วิทยาลัยนานาชาตินวัตกรรมดิจิทัล มหาวิทยาลัยเชียงใหม่
13 พฤศจิกายน 2568
เข้าใจความหมายหรือคำจำกัดความของคำว่า “ข้อมูล”
สามารถระบุและอธิบายประเภทต่าง ๆ ของข้อมูลได้
สามารถระบุลักษณะสำคัญของข้อมูลได้
ข้อมูลคือสารสนเทศ ซึ่งมักอยู่ในรูปของข้อเท็จจริง ตัวเลข การสังเกต หรือการวัดค่าที่สามารถถูกรวบรวม วิเคราะห์ และนำมาใช้เพื่อสนับสนุนการตัดสินใจ การให้เหตุผล การสื่อสาร หรือการประมวลผลทางดิจิทัล
ข้อเท็จจริงที่ใช้เป็นพื้นฐานสำหรับการให้เหตุผล การอภิปราย หรือการคำนวณ
ข้อมูลที่ได้จากอุปกรณ์ตรวจจับ (sensing device) หรือส่วนประกอบต่าง ๆ ซึ่งมักมีทั้งข้อมูล
ที่มีประโยชน์และข้อมูลที่ไม่เกี่ยวข้องหรือซ้ำซ้อน ซึ่งจำเป็นต้องผ่านการประมวลผลจึงจะมีความหมาย
ข้อมูลมาจากที่ใด?
ข้อมูลเชิงสังเกต (Observational): บันทึกจากเหตุการณ์จริงแบบเรียลไทม์ มักเกิดขึ้นนอกห้องปฏิบัติการ
ข้อมูลเชิงทดลอง (Experimental): เกิดจากการทดลองในห้องปฏิบัติการหรือภายใต้สภาวะที่มีการควบคุม
ข้อมูลจากการจำลอง (Simulation): สร้างขึ้นโดยแบบจำลองหรือโปรแกรมคอมพิวเตอร์
ข้อมูลที่สังเคราะห์หรือรวบรวม (Derived/Compiled): ได้มาจากแหล่งข้อมูลที่มีอยู่เดิม
ข้อความ (Text): บันทึก ข้อความตอบแบบสอบถาม
ตัวเลข (Numbers): ตาราง จำนวน การวัดค่า
เสียง/ภาพ (Audio/Visual): ภาพถ่าย เสียงบันทึก วิดีโอ
แบบจำลอง รหัสคอมพิวเตอร์ หรือข้อมูลเชิงพื้นที่ (Models, Computer Code, Geospatial Data)
ข้อมูลของบริษัท/ธุรกิจ/อุตสาหกรรม (Firm/Business/Industry Data):
ตัวอย่างเช่น ยอดขาย ค่าใช้จ่าย ปริมาณสินค้าและบริการที่ผลิตและจำหน่าย เป็นต้น
ข้อมูลระดับบุคคลหรือครัวเรือน (Individual or Household-Level Data):
ตัวอย่างเช่น รายได้ การจ้างงาน ระดับการศึกษา ขนาดครัวเรือน อายุ เพศ เป็นต้น
คำอธิบายเพิ่มเติม (Further Explanation):
ข้อมูลเศรษฐศาสตร์จุลภาค (Microeconomics Data) หมายถึง ข้อมูลที่ใช้ในการศึกษาพฤติกรรมของหน่วยเศรษฐกิจขนาดเล็ก เช่น บุคคล ครัวเรือน บริษัท หรืออุตสาหกรรม ซึ่งช่วยให้เราเข้าใจปัจจัยที่มีอิทธิพลต่อการตัดสินใจทางเศรษฐกิจ เช่น การบริโภค การลงทุน การจ้างงาน และการกำหนดราคาของสินค้าและบริการ
ข้อมูลของบริษัท/ธุรกิจ/อุตสาหกรรม ใช้ในการวิเคราะห์ประสิทธิภาพของธุรกิจ กลยุทธ์การตั้งราคา และแนวโน้มของตลาด
ข้อมูลระดับบุคคลหรือครัวเรือน ใช้ในการศึกษาพฤติกรรมการบริโภค ความเหลื่อมล้ำของรายได้ และผลกระทบของนโยบายเศรษฐกิจต่อประชาชน
ข้อมูลสำมะโนประชากร (Census Data): เช่น อัตราการว่างงาน ระดับรายได้ในแต่ละเปอร์เซ็นไทล์ เป็นต้น
อัตราเงินเฟ้อ (Inflation Rate): การเปลี่ยนแปลงโดยรวมของระดับราคาสินค้าและบริการในระบบเศรษฐกิจ
ข้อมูลตลาดที่อยู่อาศัย (Housing Market Data): เช่น อัตราการเป็นเจ้าของบ้าน ร้อยละของประชากรที่เช่าที่อยู่อาศัย เป็นต้น
ปริมาณทรัพยากรสำคัญ (Quantities of Key Resources): เช่น น้ำมัน ไม้ น้ำ ไฟฟ้า และโลหะต่าง ๆ
คำอธิบายเพิ่มเติม (Further Explanation):
ข้อมูลเศรษฐศาสตร์มหภาค (Macroeconomic Data) หมายถึง ข้อมูลที่ใช้ในการศึกษาภาพรวมของเศรษฐกิจ ไม่ได้มุ่งเน้นเฉพาะหน่วยย่อยอย่างบุคคลหรือบริษัท แต่พิจารณาในระดับประเทศหรือระดับโลก
ข้อมูลสำมะโนประชากร ใช้ในการวิเคราะห์โครงสร้างประชากรและตลาดแรงงาน
ตัวอย่างเช่น อัตราการว่างงานที่สูงอาจบ่งชี้ถึงภาวะเศรษฐกิจถดถอย
อัตราเงินเฟ้อ เป็นตัวชี้วัดสำคัญของค่าครองชีพ
หากเงินเฟ้อสูงเกินไป อาจทำให้กำลังซื้อของประชาชนลดลง
ข้อมูลตลาดที่อยู่อาศัย สะท้อนสภาพเศรษฐกิจในปัจจุบัน
อัตราการเป็นเจ้าของบ้านที่สูงอาจบ่งบอกถึงเสถียรภาพทางเศรษฐกิจ
ปริมาณทรัพยากรสำคัญ มีผลต่อการผลิตและการกำหนดราคา
ตัวอย่างเช่น ราคาน้ำมันที่เพิ่มขึ้นอาจส่งผลต่อค่าขนส่งและราคาสินค้าอื่น ๆ ทั่วทั้งระบบเศรษฐกิจ
ปริมาณและมูลค่าการซื้อขายของหุ้นหรือสินค้าโภคภัณฑ์เฉพาะ เช่น
ทองคำและโลหะอื่น ๆ
สินค้าเกษตร (อาหาร)
พลังงาน

คำอธิบายเพิ่มเติม (Further Explanation):
ข้อมูลทางการเงิน (Financial Data) ใช้ในการวิเคราะห์ความเคลื่อนไหวของตลาดทุน ตลาดสินค้าโภคภัณฑ์ และแนวโน้มทางเศรษฐกิจที่เกี่ยวข้องกับการลงทุน
ปริมาณการซื้อขาย (Trading Volume) หมายถึง จำนวนหน่วยของสินทรัพย์
(เช่น หุ้น ทองคำ น้ำมัน) ที่ถูกซื้อหรือขายภายในระยะเวลาหนึ่ง ซึ่งสะท้อนถึงสภาพคล่องของตลาด
มูลค่าการซื้อขาย (Trading Value) หมายถึง มูลค่าทางการเงินของธุรกรรมที่เกิดขึ้นในตลาด
แสดงถึงระดับความสนใจของนักลงทุนและแนวโน้มราคาของสินทรัพย์
สินค้าโภคภัณฑ์ (Commodities) เช่น ทองคำและน้ำมัน เป็นสินทรัพย์ทางเศรษฐกิจที่สำคัญ
และมักถูกใช้เป็นเครื่องมือป้องกันความเสี่ยงจากภาวะเงินเฟ้อ
ข้อมูลประเภทนี้มีความสำคัญอย่างยิ่งในการวิเคราะห์แนวโน้มของตลาดหุ้น การบริหารความเสี่ยงทางการเงิน และการตัดสินใจลงทุนอย่างมีข้อมูลประกอบ
ข้อมูลเชิงโครงสร้าง (Structured Data) มักถูกจัดอยู่ในประเภทข้อมูลเชิงปริมาณ และเป็นรูปแบบข้อมูลที่เราคุ้นเคยมากที่สุด ลักษณะของข้อมูลเชิงโครงสร้างจะคล้ายกับตารางหรือเมทริกซ์
แถวแรกประกอบด้วยชื่อของตัวแปร
ข้อมูลจะเริ่มตั้งแต่แถวที่สองเป็นต้นไป
แต่ละแถวต้องมีข้อมูลครบทุกคอลัมน์
แต่ละคอลัมน์ต้องมีข้อมูลเพียงประเภทเดียว เช่น เป็นข้อความ หรือเป็นตัวเลขเท่านั้น
เป็นภาษาคอมพิวเตอร์ที่ใช้สำหรับจัดการข้อมูลเชิงโครงสร้าง
โดยเฉพาะฐานข้อมูลเชิงสัมพันธ์ (Relational Databases หรือ SQL)
ผู้ใช้งานทางธุรกิจสามารถป้อนข้อมูล สืบค้น และจัดการข้อมูลเชิงโครงสร้างได้อย่างมีประสิทธิภาพ
นักศึกษาจะได้เรียนรู้และฝึกฝนการจัดการข้อมูลเบื้องต้นโดยใช้ Excel
Employee Attrition (2015) จาก IBM Watson Analytics
เป็นชุดข้อมูลสาธารณะที่ใช้กันอย่างแพร่หลายในการสาธิตการวิเคราะห์เชิงคาดการณ์ โดยเฉพาะการสร้างแบบจำลองการลาออกของพนักงาน (Employee Turnover Modeling) ซึ่งถูกเผยแพร่โดย IBM เพื่อสนับสนุนการเรียนรู้ด้านวิทยาศาสตร์ข้อมูลและการวิเคราะห์ทรัพยากรมนุษย์ (HR Analytics)
ข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data) หมายถึงข้อมูลที่ไม่ได้ถูกจัดระเบียบในรูปแบบที่กำหนดไว้ล่วงหน้า
เช่น ตารางใน ฐานข้อมูลเชิงสัมพันธ์ (Relational Database)
ซึ่งไม่สามารถจัดเรียงให้อยู่ในรูปของแถวและคอลัมน์ได้ง่าย
ลักษณะของข้อมูลที่ไม่มีโครงสร้าง
ไม่มีโครงสร้างตายตัว
ยากต่อการจัดเก็บและวิเคราะห์ด้วยวิธีดั้งเดิม
มักมีปริมาณมาก (Big Data)
ข้อมูลข้อความ (Text Data): เช่น อีเมล ข้อความในสื่อสังคมออนไลน์ บทความ ฯลฯ
ข้อมูลภาพและวิดีโอ (Images and Videos): เช่น ไฟล์ JPEG, PNG, MP4 หรือ MKV
ไฟล์เสียง (Audio Files): เช่น เสียงบันทึก พอดแคสต์ หรือไฟล์ MP3
ข้อมูลจากสื่อสังคมออนไลน์ (Social Media Data): เช่น โพสต์ ความคิดเห็น หรือทวีต
ข้อมูลจากเซนเซอร์และ IoT (Sensor and IoT Data): เช่น ข้อมูลจากกล้องวงจรปิด (CCTV) หรืออุปกรณ์ตรวจจับต่าง ๆ
👍 ข้อดี (Pros)
ให้ข้อมูลเชิงลึกมากกว่าข้อมูลเชิงโครงสร้าง
มีประโยชน์ในการวิเคราะห์พฤติกรรมและแนวโน้มของผู้ใช้งาน
เป็นแหล่งข้อมูลสำคัญในยุคดิจิทัล (เช่น ด้านการตลาด สื่อสังคมออนไลน์ และปัญญาประดิษฐ์)
👎 ข้อเสีย (Cons)
ต้องใช้เทคโนโลยีขั้นสูงในการจัดเก็บและวิเคราะห์
ต้องการพื้นที่จัดเก็บข้อมูลขนาดใหญ่
มีความซับซ้อนในการประมวลผลและการดึงข้อมูลกลับมาใช้
ความแตกต่างหลัก 5 ประการระหว่างข้อมูลเชิงโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง
ข้อมูลเชิงโครงสร้าง มีการกำหนดรูปแบบไว้อย่างชัดเจนและสามารถค้นหาได้ง่าย
ในขณะที่ ข้อมูลที่ไม่มีโครงสร้าง มักถูกจัดเก็บในรูปแบบดิบ (Raw Data) หรือรูปแบบดั้งเดิม
ข้อมูลเชิงโครงสร้าง มักเป็นข้อมูลเชิงปริมาณ (Quantitative)
ส่วน ข้อมูลที่ไม่มีโครงสร้าง มักเป็นข้อมูลเชิงคุณภาพ (Qualitative)
ข้อมูลเชิงโครงสร้าง มักถูกจัดเก็บไว้ใน Data Warehouse
ขณะที่ ข้อมูลที่ไม่มีโครงสร้าง มักถูกจัดเก็บใน Data Lake
ข้อมูลเชิงโครงสร้าง ค้นหาและวิเคราะห์ได้ง่ายกว่า
แต่ ข้อมูลที่ไม่มีโครงสร้าง ต้องผ่านการประมวลผลและตีความเพิ่มเติม
ข้อมูลเชิงโครงสร้าง มักบันทึกในไฟล์มาตรฐาน เช่น .txt, .csv, หรือ .xlsx
ส่วน ข้อมูลที่ไม่มีโครงสร้าง มักอยู่ในรูปแบบที่หลากหลาย เช่น .doc, .pdf, .jpeg, .mov, .mp4, หรือ .wav
ข้อมูลกึ่งโครงสร้าง (Semi-Structured Data) หมายถึงข้อมูลที่ ไม่ได้อยู่ในรูปแบบโครงสร้างดั้งเดิม ของฐานข้อมูลเชิงสัมพันธ์ (ข้อมูลเชิงโครงสร้าง (Structured Data))
แต่ยังคงมี องค์ประกอบการจัดระเบียบข้อมูลบางอย่าง เช่น แท็ก (tags) หรือ เมตาดาตา (metadata)
ซึ่งช่วยอธิบายลักษณะและความหมายของข้อมูลได้
มี โครงสร้างบางส่วน เช่น การใช้แท็ก (tags) หรือรูปแบบ คู่คีย์–ค่า (key-value pairs)
ไม่ได้จัดเรียงในรูปแบบตารางที่ชัดเจน แต่ยัง จัดการและวิเคราะห์ได้ง่ายกว่า ข้อมูลที่ไม่มีโครงสร้าง
มักถูกใช้ในระบบที่ต้องการ ความยืดหยุ่นในการจัดระเบียบข้อมูล
4. NoSQL Databases (เช่น MongoDB, Cassandra)
ใช้สำหรับจัดเก็บข้อมูลในรูปแบบ JSON หรือโครงสร้างแบบเอกสาร (Document-Based Structure)
มีความยืดหยุ่นมากกว่าฐานข้อมูลเชิงสัมพันธ์ (SQL)
บิ๊กดาต้าและคลาวด์สตอเรจ (Big Data & Cloud Storage): ใช้สำหรับจัดเก็บข้อมูลขนาดใหญ่ที่มีความยืดหยุ่นสูง
บริการเว็บและ API (Web Services & APIs): ใช้รูปแบบ JSON/XML เพื่อแลกเปลี่ยนข้อมูลระหว่างระบบ
การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ (Machine Learning & AI): ใช้จัดเก็บและประมวลผลข้อมูลที่มีโครงสร้างบางส่วน
👍 ข้อดี (Pros)
👎 ข้อเสีย (Cons)
คลังข้อมูล (Data Warehouse): ใช้สำหรับจัดเก็บ ข้อมูลเชิงโครงสร้าง ที่ผ่านการประมวลผลและทำความสะอาดแล้ว เหมาะสำหรับการวิเคราะห์ทางธุรกิจ (Business Intelligence) และการสร้างรายงาน (Reporting)
ทะเลสาบข้อมูล (Data Lake): ใช้จัดเก็บข้อมูลทั้ง ที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้าง ในรูปแบบดิบ (Raw Data) เหมาะสำหรับงานด้าน Big Data, การวิเคราะห์เชิงลึก, และ Machine Learning
เลคเฮาส์ข้อมูล (Data Lakehouse): เป็นการผสมผสานจุดแข็งของ Data Warehouse และ Data Lake เข้าด้วยกัน โดยรองรับทั้งการจัดเก็บข้อมูลดิบและข้อมูลที่ผ่านการประมวลผล เพื่อให้สามารถทำทั้งการวิเคราะห์และการเรียนรู้ของเครื่องได้ในระบบเดียว
ในทางสถิติมีประเภทของข้อมูลหลากหลายรูปแบบที่ถูกเก็บรวบรวม วิเคราะห์ ตีความ และนำเสนอ
ข้อมูลเชิงคุณภาพ (Qualitative data) หรือที่เรียกว่า ข้อมูลเชิงประเภท (categorical data) หมายถึงข้อมูลที่ไม่ใช่ตัวเลข ใช้สำหรับจัดจำแนกหรือจัดหมวดหมู่สิ่งต่าง ๆ โดยมักแสดงในรูปของ คำ ข้อความ หรือสัญลักษณ์ ที่บรรยายลักษณะหรือคุณสมบัติ
ลักษณะสำคัญของข้อมูลเชิงคุณภาพ
ไม่สามารถคำนวณเป็นค่าตัวเลขได้โดยตรง
มักแสดงด้วยชื่อ หมวดหมู่ หรือป้ายกำกับ (labels)
ข้อมูลประเภทนี้ยังแบ่งย่อยได้เป็น 2 ประเภทหลัก ๆ คือ:
1. ข้อมูลนามบัญญัติ (Nominal Data)
ตัวอย่าง:
เพศ (Gender): ชาย, หญิง
สีของรถยนต์ (Car Color): แดง, น้ำเงิน, ขาว, ดำ
สัญชาติ (Nationality): ไทย, ญี่ปุ่น, อเมริกัน
ประเภทของสัตว์เลี้ยง (Type of Pet): สุนัข, แมว, นก, ปลา
ลักษณะสำคัญ:
2. ข้อมูลลำดับขั้น (Ordinal Data)
ตัวอย่าง:
ระดับการศึกษา (Education Level): ประถมศึกษา, มัธยมศึกษา, ปริญญาตรี, ปริญญาโท
ระดับความพึงพอใจ (Satisfaction Level): ต่ำ, ปานกลาง, สูง
ระดับโรงแรม (Hotel Rating): 3 ดาว, 4 ดาว, 5 ดาว
ตำแหน่งงาน (Job Position): พนักงาน, ผู้จัดการ, ผู้บริหาร
ลักษณะสำคัญ:
ข้อมูลเชิงปริมาณ (Quantitative Data) หรือ ข้อมูลเชิงตัวเลข (Numerical Data)
หมายถึงข้อมูลที่สามารถ วัดหรือคำนวณได้โดยตรงด้วยตัวเลข
ข้อมูลประเภทนี้สามารถนำไปใช้ในการคำนวณทางคณิตศาสตร์และสถิติ เช่น
การหาค่าเฉลี่ย (mean), ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) หรือสัดส่วน (proportion)
ลักษณะของข้อมูลเชิงปริมาณ
แสดงในรูปของตัวเลขและสามารถนำไปใช้ในการคำนวณได้
สามารถ จัดอันดับ จัดลำดับ และเปรียบเทียบค่า กันได้
เหมาะสำหรับ การวิเคราะห์ทางสถิติ เช่น การหาค่ามัธยฐาน (median) และความแปรปรวน (variance)
ข้อมูลเชิงปริมาณสามารถแบ่งออกได้เป็น 2 ประเภทหลัก ได้แก่:
1. ข้อมูลไม่ต่อเนื่อง (Discrete Data)
ตัวอย่าง: จำนวนคนในครอบครัว จำนวนรถที่ขายได้ จำนวนห้องในอาคาร
2. ข้อมูลต่อเนื่อง (Continuous Data)
ข้อมูลที่สามารถมี ค่าระหว่างตัวเลขได้ (เป็นข้อมูลที่วัดได้)
สามารถมี ทศนิยม หรือค่าที่มีความละเอียดมากขึ้นได้
ตัวอย่าง: น้ำหนัก ส่วนสูง อุณหภูมิ ระยะทาง รายได้
Ahmed, M., & Pathan, A. S. K. (Eds.). (2018). Data analytics: concepts, techniques, and applications. CRC Press.
S. (2021, April 12). 6 Types of Data in Statistics & Research: Key in Data Science. Blog for Data-Driven Business. https://www.intellspot.com/data-types/
(n.d.). https://www.w3schools.com/python/python_datatypes.asp
Taylor, C. (2022, June 6). Structured vs. Unstructured Data. Datamation. https://www.datamation.com/big-data/structured-vs-unstructured-data/