แบบจำลองที่เหมาะสมในการจำแนกหมวดหมู่ข้อความหนังสือเผยแพร่ความรู้
0
0
Files
Issued Date
2021
Resource Type
Language
tha
File Type
application/pdf
Rights
Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)
Rights Holder(s)
มหาวิทยาลัยสุโขทัยธรรมาธิราช
Suggested Citation
ประภัสสร ข่ายกระโทก (2021). แบบจำลองที่เหมาะสมในการจำแนกหมวดหมู่ข้อความหนังสือเผยแพร่ความรู้. สืบค้นจาก: https://hdl.handle.net/20.500.14770/13784
Alternative Title(s)
An optimal model for text categorization for knowledge dissemination book
Author(s)
Advisor(s)
Other Contributor(s)
Abstract
การวิจัยนี้มีวัตถุประสงค์เพื่อ 1) ศึกษาและวิเคราะห์ระบบหนังสือเผยแพร่ความรู้ 2) พัฒนาแบบจำลองการจำแนกหมวดหมู่ข้อความหนังสือเผยแพร่ความรู้ 3) ประเมินแบบจำลองการจำแนกหมวดหมู่ข้อความหนังสือเผยแพร่ความรู้ การวิจัยใช้ชุดข้อมูลหนังสือเผยแพร่ความรู้ ตั้งแต่ปี 2553 -2563 ในรูปแบบระบบวารสารอิเล็กทรอนิกส์ออนไลน์ และทำการวิเคราะห์คำสำคัญจากหนังสือเผยแพร่ความรู้จำนวน 948 คำเพื่อจัดกลุ่มจำแนกหมวดหมู่ด้วยการพัฒนาสร้างแบบจำลองจาก 4 อัลกอริทึม ได้แก่อัลกอริทึมต้นไม้การตัดสินใจ อัลกอริทึมนาอีฟเบย์ อัลกอริทึมซัพพอร์ตเวคเตอร์แมชชีน และอัลกอริทึมการถดถอยโลจีสติก โดยใช้การเลือกคุณลักษณะแบบค่าเกณฑ์ความรู้เพื่อประเมินประสิทธิภาพของแต่ละอัลกอริทึม การทดสอบแบ่งชุดข้อมูลเป็น 2 ส่วนได้แก่ ชุดข้อมูลสำหรับการฝึกสอน และชุดข้อมูลสำหรับการทดสอบจากผลการประเมินพบว่า 1) ระบบหนังสือเผยแพร่ความรู้สามารถจำแนกหมวดหมู่ข้อความได้ 4 หมวดหมู่ ได้แก่ หมวดหมู่ยุทธศาสตร์ หมวดหมู่ยุทธการ หมวดหมู่ยุทธวิธี และหมวดหมู่อื่นๆ และ 2) การพัฒนาสร้างแบบจำลองจากทั้ง 4 อัลกอริทึมด้วยการประเมินประสิทธิภาพเพื่อจำแนกหมวดหมู่ข้อความหนังสือเผยแพร่ความรู้พบว่า 3) อัลกอริทึมการถดถอยโลจีสติกและอัลกอริทึมซัพพอร์ตเวคเตอร์แมชชีน มีค่าความถูกต้องเท่ากับ 0.87 อัลกอริทึมนาอีฟเบย์มีค่าความถูกต้องเท่ากับ 0.85 และอัลกอริทึมต้นไม้การตัดสินใจมีค่าความถูกต้องเท่ากับ0.82 และแบบจำลองที่เหมาะสมได้แก่ อัลกอริทึมการถดถอยโลจีสติกเนื่องจากอัลกอริทึมการถดถอยโลจีสติกใช้เวลาในการจำแนกหมวดหมู่ข้อความหนังสือเผยแพร่ความรู้ใช้เวลาน้อยกว่าอัลกอริทึมซัพพอร์ตเวคเตอร์แมชชีนเป็นร้อยละ 11.8
The objectives of this research were 1) to study and analyze the knowledge dissemination book system, 2) to develop a model for categorizing the text of knowledge dissemination books, and 3) to evaluate a text classification model of the knowledge dissemination books. In this research, the knowledge book dataset that was an online e-journal system from 2010 to 2020 was analyzed to classify a category of the knowledge books with 948 keywords by using the development of modeling from 4 algorithms that included decision tree algorithm,Naïve Bayes algorithm, support vector machine algorithm, and logistic regression algorithm. All algorithms used the knowledge threshold feature selection to assess the performance of the algorithms. The test data was divided into two parts that were training dataset and testing dataset. The evaluation results revealed that 1) all algorithms could categorize books into 4 categories that included strategic category, operational category, tactical category, and other categories and 2) the developed model was developed by the performance assessment from the four algorithms to categorize books and 3) each algorithm found that the logistic regression algorithm and the support vector machine algorithm had an accuracy of 0.87, the Naïve Bayes algorithm had an accuracy of 0.85 and the decision tree algorithm had an accuracy of 0.82. For an optimal model, it was the logistic regression algorithm that it took a time for processing less than the support vector machine algorithm to categorize knowledge dissemination books approximately 11.8 percent.
The objectives of this research were 1) to study and analyze the knowledge dissemination book system, 2) to develop a model for categorizing the text of knowledge dissemination books, and 3) to evaluate a text classification model of the knowledge dissemination books. In this research, the knowledge book dataset that was an online e-journal system from 2010 to 2020 was analyzed to classify a category of the knowledge books with 948 keywords by using the development of modeling from 4 algorithms that included decision tree algorithm,Naïve Bayes algorithm, support vector machine algorithm, and logistic regression algorithm. All algorithms used the knowledge threshold feature selection to assess the performance of the algorithms. The test data was divided into two parts that were training dataset and testing dataset. The evaluation results revealed that 1) all algorithms could categorize books into 4 categories that included strategic category, operational category, tactical category, and other categories and 2) the developed model was developed by the performance assessment from the four algorithms to categorize books and 3) each algorithm found that the logistic regression algorithm and the support vector machine algorithm had an accuracy of 0.87, the Naïve Bayes algorithm had an accuracy of 0.85 and the decision tree algorithm had an accuracy of 0.82. For an optimal model, it was the logistic regression algorithm that it took a time for processing less than the support vector machine algorithm to categorize knowledge dissemination books approximately 11.8 percent.
Description
วิทยานิพนธ์ (วท.ม. (เทคโนโลยีสารสนเทศและการสื่อสาร))-- มหาวิทยาลัยสุโขทัยธรรมาธิราช, 2564
Degree Name
วิทยาศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิทยาศาสตร์และเทคโนโลยี
Degree Grantor(s)
มหาวิทยาลัยสุโขทัยธรรมาธิราช
Subject(s)
View online Resources
Collections
Endorsement
Review
Supplemented By
Referenced By
Creative Commons license
Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)

