Download

Filter_Search

วารสาร : ปีที่ 4 ฉบับที่ 1 มกราคม-มิถุนายน 2560
ชื่องานวิจัย (TH): การเปรียบเทียบประสิทธิภาพอัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย
ชื่องานวิจัย (EN) : A Comparison of Frequent Itemsets Mining Algorithms
ผู้วิจัย : ทวีศักดิ์ คงตุก
บทคัดย่อ (TH) : 

การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อ 1) ศึกษา และเปรียบเทียบอัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย (Frequent Item sets) ซึ่งเป็นขั้นตอนหนึ่งในกระบวนการทำเหมืองข้อมูลกฏความสัมพันธ์ (Association Rule Mining) 2) ศึกษาชุดข้อมูลที่ใช้สำหรับการทดสอบอัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย และ 3) สรุปผลได้ว่าอัลกอริทึมใด เหมาะกับชุดข้อมูลลักษณะใด และอัลกอริทึมใดทำงานได้เร็วที่สุดหรือใช้หน่วยความจำน้อยที่สุด
ผลการวิจัยพบว่า 1) อัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย มีข้อดีและข้อเสียแตกต่างกันไป ดังนั้นแต่ละอัลกอริทึมจะเหมาะสำหรับการใช้วิเคราะห์ชุดข้อมูลที่แตกต่างกัน 2) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดใหญ่และมีความหนาแน่นมาก คืออัลกอริทึม FP-Growth, Apriori และ PrePost+
3) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดใหญ่และมีความหนาแน่นน้อย คืออัลกอริทึม LCMFreq
4) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดเล็กและมีความหนาแน่นน้อย คืออัลกอริทึม LCMFreq และ5) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดเล็กและมีความหนาแน่นมาก คืออัลกอริทึม PrePost+, LCMFreq

Abstract : 

This research aimed to 1) study and compare algorithm used for searching Frequent Itemsets, which is one of the process of association rule mining; 2) explore procedure of algorithm method and techniques used for searching of frequent Itemsets; and 3) summarize which algorithm is the best fit with each type of data and which one has the best performance of executing time or with the least memory.
According to the findings of the study, they can be concluded that (1) each algorithm used for searching Frequent Itemsets has different advantages and disadvantages. Thus, each algorithm will be used to analyze different type of dataset. (2) The fastest algorithm for large dataset with high density were FP-Growth, Apriori and PrePost+. (3) The algorithm that consumes the shortest time for large dataset with low density was LCMFreq. (4) The algorithm that consumes the shortest time for small dataset with low density was LCMFreq. And (5) the algorithm that consumes the shortest time for small dataset with high density were PrePost+ and LCMFreq.

Keywords : Apriori Algorithm, Frequent Itemsets, Association Rules Mining, Data Mining
Full Paper : Download

<< ย้อนกลับ | |