Page 104 - ถักร้อยความรู้ภูมิศาสตร์อันหลากหลาย : หมุดหมายความรู้ครบรอบ 60 ปี
P. 104
ในการทด้สิอบและลีฟโห้นด้ (Leaf node) แสิด้งกลุ่มิที�กำาห้นด้ไว้ ซัึ�งตั้้นไมิ้ช่วยการตั้้ด้สิินใจนี�ง่ายตั้่อการ
ปีร้บเปีลี�ยนเปี็นกฎีการจำาแนกปีระเภทข้อมิูล (Classification rule) การพยากรณ์ข้อมิูล (Data prediction )
การสิร้างตั้้นไมิ้ตั้้ด้สิินใจจะสิร้างในล้กษณะจากบนลงล่าง (Top-down) น้�นก็คือเริ�มิจากการห้าความิสิ้มิพ้นธิ์
ของแอตั้ทริบิวตั้์ซัึ�งคำานวณได้้จากค่าที�ใช้เปี็นตั้้วว้ด้ เรียกว่า Information Gain (IG) สิามิารถึคำานวณได้้จาก
สิมิการอ้างอิงใน Quinlan (1986) ในข้�นตั้อนการสิร้างตั้้วแบบของ Decision Tree จะคำานวณค่า IG ของ
แตั้่ละแอตั้ทริบิวตั้์เทียบก้บคลาสิเพื�อห้าแอตั้ทริบิวตั้์ที�มิีค่า IG มิากที�สิุด้มิาเปี็น Root ของ Decision Tree
2) Extreme Gradient Boosting และ CatBoost เปี็นอ้ลกอริทึมิที�มิีโครงสิร้างพื�นฐานมิากจาก
ตั้้นไมิ้ตั้้ด้สิินใจ เช่น Decision Tree, Random Forest, Bagging , Boosting , Gradient Boosting มิีการ
พ้ฒนาเพิ�มิเตั้ิมิและนำามิาใช้เพื�อแก้ปีัญห้าเรื�องความิแปีรปีรวนของข้อมิูล เช่นข้อมิูลมิีค่าว่าง เนื�องจากมิีข้อมิูล
ให้มิ่เข้ามิา สิำาห้ร้บ CatBoost เปี็นวิธิี Gradient Boosting ที�พ้ฒนาเพื�อเพิ�มิปีระสิิทธิิภาพของแบบจำาลอง
ให้้สิามิารถึทำานายได้้รวด้เร็ว (Ibrahem Ahmed Osman et al., 2021)
3) กฎีควัามสัมพันุธ์์ (Association rules) คือ การค้นห้าความิสิ้มิพ้นธิ์ของข้อมิูลจากข้อมิูล
ขนาด้ให้ญ่ที�มิีอยู่เพื�อช่วยในการวิเคราะห้์และตั้้ด้สิินใจในธิุรกิจ เปี้าห้มิายของการค้นห้ากฎีความิสิ้มิพ้นธิ์ คือ
จะแยกและด้ึงสิิ�งที�ซั่อนไว้ในฐานข้อมิูลได้้อย่างไร และจะห้ารายการ (Item) ใน Transaction เด้ียวก้นได้้อย่างไร
ซัึ�งจะสิามิารถึบอกได้้ว่ารายการใด้ที�มิีแนวโน้มิที�จะสิามิารถึพบด้้วยก้นใน Transaction รูปีแบบท้�วไปีของการ
ค้นห้ากฎีความิสิ้มิพ้นธิ์ คือ A| |B โด้ยที� A: เปี็นเงื�อนไข และ B : เปี็นผู้ลล้พธิ์ที�เกิด้ขึ�น ห้รืออยู่ในรูปีของ “ถึ้า…….
แล้ว” (If……Then….) เช่น
A| |B; if A Then B เปี็นกฎีที� 1 A| |B; if B Then A เปี็นกฎีที� 2
การปีระเมิินค่าของกฎีจะใช้ค่าสิน้บสินุน (Support) และค่าความิเชื�อมิ้�น (Confidence) โด้ยที�ค่าสิน้บสินุน
คือ ร้อยละของข้อมิูลที�มิีเงื�อนไขและผู้ลล้พธิ์สิอด้คล้องตั้ามิกฎีตั้่อจำานวนข้อมิูลท้�งห้มิด้ ค่าความิเชื�อมิ้�น คือ
ร้อยละของข้อมิูลที�มิีเงื�อนไขและผู้ลล้พธิ์สิอด้คล้องตั้ามิกฎีตั้่อจำานวนข้อมิูลท้�งห้มิด้ที�เปี็นเงื�อนไข ในการเลือก
ว่าจะกฎีใด้น้�นจะตั้้องพิจารณาค่าสิน้บสินุน และค่าความิเชื�อมิ้�นที�มิีค่าสิูงกว่าค่า Threshold ที�ตั้้�งไว้ นอกจาก
นี�จะตั้้องกำาห้นด้ค่าสิน้บสินุนตั้ำ�าสิุด้ (Minimum support) และค่าความิเชื�อมิ้�นตั้ำ�าสิุด้ (Minimum confidence)
(Han and Kamber, 2001)
4) โครงข่ายป็ระสาที่เที่ียม (Artificial Neural Network) คือ การทำางานของคอมิพิวเตั้อร์
ที�สิามิารถึเลียนแบบการทำางานของสิมิองมินุษย์ได้้ด้้วยการปีระมิวลผู้ลข้อมิูล นอกจากนี� ย้งสิามิารถึร้บและ
จด้จำาข้อมิูลในรูปีแบบที�เปี็นปีระสิบการณ์ได้้ ทำาให้้สิามิารถึเชื�อมิโยงข้อเท็จจริง จ้ด้เก็บไว้และนำามิาเรียนรู้เพื�อ
ห้าความิเกี�ยวข้องก้นของข้อมิูล วิธิีการของโครงข่ายปีระสิาทเทียมิเปี็นวิธิีการที�ให้้เครื�องเรียนรู้จากตั้้วอย่าง
104 ถักร้อยความรู้ภูมิศาสตร์อันหลากหลาย:
หมุดหมายความรู้ ครบรอบ 60 ปี