Thai Academic Reference Database » National Conference on Computer Information Technologies » CIT 2010 »

Please use this identifier to cite or link to this item: http://tar.thailis.or.th/handle/123456789/30

Title: Ensembling for a Reliable Thai Web Snippet Clustering
Other Titles: การประสานคำตอบสำหรับการจัดกลุ่มผลการสืบค้นเว็บภาษาไทยที่มีความน่าเชื่อถือ
Authors: พัชระ นาเสงี่ยม
สิรภัทร เชี่ยวชาญวัฒนา
คำรณ สุนัติ
Keywords: Quantum Clustering Algorithm
Online Spherical K-Means
Hybrid Bipartite Graphs Formulation
Web Snippet
Issue Date: 15-Mar-2010
Publisher: สำนักงานคณะกรรมการการอุดมศึกษา
Abstract: Practically applying a clustering algorithm may not get a good result because we lack of some important information or we cannot control the expected outcome. For a thai web snippet clustering, if it is performed by the Online Spherical K-Means (OSKM), the accuracy might be very high for the most cased but might be unreliable in some cases. If it is done by the Quantum Clustering (QC) algorithm, the number of clusters might be varied and might hard to select a proper outcome. This research solves this problem by using the Hybrid Bipartite Graph Formulation (HBGF) ensembling technique. The individual datum and the individual cluster are formed as the vertices of bipartite graphs, which is then partitioned by the spectral graph partitioning algorithm. Both the HBGF-OSKM and the HBFG-QC yield more reliable clustering results, accordingly.
Description: การนำเอาขั้นตอนวิธีการจัดกลุ่มไปใช้จริงนั้นบางครั้งไม่สามารถใช้งานได้ดีเพราะไม่รู้ข้อมูลสำคัญบางอย่างล่วงหน้าหรือได้ผลลัพธ์ที่ไม่สามารถเจาะจงได้ การจัดกลุ่มเว็บไซต์จากคำอธิบายสั้นๆ ถ้าใช้ขั้นตอนวิธี Online Spherical K-Means (OSKM) ให้ผลการจัดกลุ่มที่มีความถูกต้องสูงแต่ไม่แน่นอน ถ้าใช้ขั้นตอนวิธี Quantum Clustering (QC) ก็ได้จำนวนกลุ่มไม่แน่นอน การใช้วิธีการผสานคำตอบของขั้นตอนการจัดกลุ่ม Hybrid Bipartite Graph Formula (HBGF) ทำให้วิธีการเดิมมีคำตอบที่มีความเชื่อถือสูงขึ้น คำสำคัญ การจัดกลุ่ม,การจัดกลุ่มด้วยกลศาสตร์ควอนตัม ,การประสานคำตอบ,คำอธิบายสั้น,Hybrid Bipartite Graphs Formulation
URI: http://tar.thailis.or.th/handle/123456789/30
Appears in Collections:CIT 2010

Files in This Item:

File Description SizeFormat
CIT2010_09.pdf383.86 kBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.


Sitemap | Privacy & Security | Terms & Conditions

Office of Information Technology Administration for Eduactional Development
328 Sri-Ayuthaya Rd, Ratchathewi, Bangkok 10400 Tel.02-3545678
ThaiLIS is Thailand Library Integrated System