DATA                  
ข้อมูล

อ.ดร. สมศักดิ์ จันทร์เอม

วิทยาลัยนานาชาตินวัตกรรมดิจิทัล มหาวิทยาลัยเชียงใหม่

13 พฤศจิกายน 2568

Source: Data Analytics Concepts, Techniques, and Applications

Source: Data Analytics Concepts, Techniques, and Applications

วัตถุประสงค์ (Objectives)

  • เข้าใจความหมายหรือคำจำกัดความของคำว่า “ข้อมูล”

  • สามารถระบุและอธิบายประเภทต่าง ๆ ของข้อมูลได้

  • สามารถระบุลักษณะสำคัญของข้อมูลได้

ข้อมูลคืออะไร? (What is Data?)

ข้อมูลคือสารสนเทศ ซึ่งมักอยู่ในรูปของข้อเท็จจริง ตัวเลข การสังเกต หรือการวัดค่าที่สามารถถูกรวบรวม วิเคราะห์ และนำมาใช้เพื่อสนับสนุนการตัดสินใจ การให้เหตุผล การสื่อสาร หรือการประมวลผลทางดิจิทัล

  1. ข้อเท็จจริงที่ใช้เป็นพื้นฐานสำหรับการให้เหตุผล การอภิปราย หรือการคำนวณ

  2. ข้อมูลที่ได้จากอุปกรณ์ตรวจจับ (sensing device) หรือส่วนประกอบต่าง ๆ ซึ่งมักมีทั้งข้อมูล

ที่มีประโยชน์และข้อมูลที่ไม่เกี่ยวข้องหรือซ้ำซ้อน ซึ่งจำเป็นต้องผ่านการประมวลผลจึงจะมีความหมาย

  1. ข้อมูลในรูปแบบตัวเลขที่สามารถส่งต่อหรือประมวลผลได้ในรูปแบบดิจิทัล

ประเภทของข้อมูล (Types of Data)

ข้อมูลมาจากที่ใด?

  • ข้อมูลเชิงสังเกต (Observational): บันทึกจากเหตุการณ์จริงแบบเรียลไทม์ มักเกิดขึ้นนอกห้องปฏิบัติการ

  • ข้อมูลเชิงทดลอง (Experimental): เกิดจากการทดลองในห้องปฏิบัติการหรือภายใต้สภาวะที่มีการควบคุม

  • ข้อมูลจากการจำลอง (Simulation): สร้างขึ้นโดยแบบจำลองหรือโปรแกรมคอมพิวเตอร์

  • ข้อมูลที่สังเคราะห์หรือรวบรวม (Derived/Compiled): ได้มาจากแหล่งข้อมูลที่มีอยู่เดิม

ข้อมูลมีได้หลายรูปแบบ (Data Can Take Many Forms)

  • ข้อความ (Text): บันทึก ข้อความตอบแบบสอบถาม

  • ตัวเลข (Numbers): ตาราง จำนวน การวัดค่า

  • เสียง/ภาพ (Audio/Visual): ภาพถ่าย เสียงบันทึก วิดีโอ

  • แบบจำลอง รหัสคอมพิวเตอร์ หรือข้อมูลเชิงพื้นที่ (Models, Computer Code, Geospatial Data)

ข้อมูลเศรษฐศาสตร์จุลภาค (Microeconomics Data)

  • ข้อมูลของบริษัท/ธุรกิจ/อุตสาหกรรม (Firm/Business/Industry Data):
    ตัวอย่างเช่น ยอดขาย ค่าใช้จ่าย ปริมาณสินค้าและบริการที่ผลิตและจำหน่าย เป็นต้น

  • ข้อมูลระดับบุคคลหรือครัวเรือน (Individual or Household-Level Data):
    ตัวอย่างเช่น รายได้ การจ้างงาน ระดับการศึกษา ขนาดครัวเรือน อายุ เพศ เป็นต้น

คำอธิบายเพิ่มเติม (Further Explanation):

ข้อมูลเศรษฐศาสตร์จุลภาค (Microeconomics Data) หมายถึง ข้อมูลที่ใช้ในการศึกษาพฤติกรรมของหน่วยเศรษฐกิจขนาดเล็ก เช่น บุคคล ครัวเรือน บริษัท หรืออุตสาหกรรม ซึ่งช่วยให้เราเข้าใจปัจจัยที่มีอิทธิพลต่อการตัดสินใจทางเศรษฐกิจ เช่น การบริโภค การลงทุน การจ้างงาน และการกำหนดราคาของสินค้าและบริการ

  • ข้อมูลของบริษัท/ธุรกิจ/อุตสาหกรรม ใช้ในการวิเคราะห์ประสิทธิภาพของธุรกิจ กลยุทธ์การตั้งราคา และแนวโน้มของตลาด

  • ข้อมูลระดับบุคคลหรือครัวเรือน ใช้ในการศึกษาพฤติกรรมการบริโภค ความเหลื่อมล้ำของรายได้ และผลกระทบของนโยบายเศรษฐกิจต่อประชาชน

ข้อมูลเศรษฐศาสตร์มหภาค (Macroeconomic Data)

  • ข้อมูลสำมะโนประชากร (Census Data): เช่น อัตราการว่างงาน ระดับรายได้ในแต่ละเปอร์เซ็นไทล์ เป็นต้น

  • อัตราเงินเฟ้อ (Inflation Rate): การเปลี่ยนแปลงโดยรวมของระดับราคาสินค้าและบริการในระบบเศรษฐกิจ

  • ข้อมูลตลาดที่อยู่อาศัย (Housing Market Data): เช่น อัตราการเป็นเจ้าของบ้าน ร้อยละของประชากรที่เช่าที่อยู่อาศัย เป็นต้น

  • ปริมาณทรัพยากรสำคัญ (Quantities of Key Resources): เช่น น้ำมัน ไม้ น้ำ ไฟฟ้า และโลหะต่าง ๆ

คำอธิบายเพิ่มเติม (Further Explanation):

ข้อมูลเศรษฐศาสตร์มหภาค (Macroeconomic Data) หมายถึง ข้อมูลที่ใช้ในการศึกษาภาพรวมของเศรษฐกิจ ไม่ได้มุ่งเน้นเฉพาะหน่วยย่อยอย่างบุคคลหรือบริษัท แต่พิจารณาในระดับประเทศหรือระดับโลก

  • ข้อมูลสำมะโนประชากร ใช้ในการวิเคราะห์โครงสร้างประชากรและตลาดแรงงาน
    ตัวอย่างเช่น อัตราการว่างงานที่สูงอาจบ่งชี้ถึงภาวะเศรษฐกิจถดถอย

  • อัตราเงินเฟ้อ เป็นตัวชี้วัดสำคัญของค่าครองชีพ
    หากเงินเฟ้อสูงเกินไป อาจทำให้กำลังซื้อของประชาชนลดลง

  • ข้อมูลตลาดที่อยู่อาศัย สะท้อนสภาพเศรษฐกิจในปัจจุบัน
    อัตราการเป็นเจ้าของบ้านที่สูงอาจบ่งบอกถึงเสถียรภาพทางเศรษฐกิจ

  • ปริมาณทรัพยากรสำคัญ มีผลต่อการผลิตและการกำหนดราคา
    ตัวอย่างเช่น ราคาน้ำมันที่เพิ่มขึ้นอาจส่งผลต่อค่าขนส่งและราคาสินค้าอื่น ๆ ทั่วทั้งระบบเศรษฐกิจ

ข้อมูลทางการเงิน (Financial Data)

ปริมาณและมูลค่าการซื้อขายของหุ้นหรือสินค้าโภคภัณฑ์เฉพาะ เช่น

  • ทองคำและโลหะอื่น ๆ

  • สินค้าเกษตร (อาหาร)

  • พลังงาน


คำอธิบายเพิ่มเติม (Further Explanation):

ข้อมูลทางการเงิน (Financial Data) ใช้ในการวิเคราะห์ความเคลื่อนไหวของตลาดทุน ตลาดสินค้าโภคภัณฑ์ และแนวโน้มทางเศรษฐกิจที่เกี่ยวข้องกับการลงทุน

  • ปริมาณการซื้อขาย (Trading Volume) หมายถึง จำนวนหน่วยของสินทรัพย์
    (เช่น หุ้น ทองคำ น้ำมัน) ที่ถูกซื้อหรือขายภายในระยะเวลาหนึ่ง ซึ่งสะท้อนถึงสภาพคล่องของตลาด

  • มูลค่าการซื้อขาย (Trading Value) หมายถึง มูลค่าทางการเงินของธุรกรรมที่เกิดขึ้นในตลาด
    แสดงถึงระดับความสนใจของนักลงทุนและแนวโน้มราคาของสินทรัพย์

  • สินค้าโภคภัณฑ์ (Commodities) เช่น ทองคำและน้ำมัน เป็นสินทรัพย์ทางเศรษฐกิจที่สำคัญ
    และมักถูกใช้เป็นเครื่องมือป้องกันความเสี่ยงจากภาวะเงินเฟ้อ

ข้อมูลประเภทนี้มีความสำคัญอย่างยิ่งในการวิเคราะห์แนวโน้มของตลาดหุ้น การบริหารความเสี่ยงทางการเงิน และการตัดสินใจลงทุนอย่างมีข้อมูลประกอบ

ข้อมูลเชิงโครงสร้าง (Structured Data)

ข้อมูลเชิงโครงสร้าง (Structured Data) มักถูกจัดอยู่ในประเภทข้อมูลเชิงปริมาณ และเป็นรูปแบบข้อมูลที่เราคุ้นเคยมากที่สุด ลักษณะของข้อมูลเชิงโครงสร้างจะคล้ายกับตารางหรือเมทริกซ์

  • แถวแรกประกอบด้วยชื่อของตัวแปร

  • ข้อมูลจะเริ่มตั้งแต่แถวที่สองเป็นต้นไป

  • แต่ละแถวต้องมีข้อมูลครบทุกคอลัมน์

  • แต่ละคอลัมน์ต้องมีข้อมูลเพียงประเภทเดียว เช่น เป็นข้อความ หรือเป็นตัวเลขเท่านั้น

ภาษาสำหรับจัดการข้อมูลเชิงโครงสร้าง (Structured Query Language: SQL)

เป็นภาษาคอมพิวเตอร์ที่ใช้สำหรับจัดการข้อมูลเชิงโครงสร้าง
โดยเฉพาะฐานข้อมูลเชิงสัมพันธ์ (Relational Databases หรือ SQL)
ผู้ใช้งานทางธุรกิจสามารถป้อนข้อมูล สืบค้น และจัดการข้อมูลเชิงโครงสร้างได้อย่างมีประสิทธิภาพ

นักศึกษาจะได้เรียนรู้และฝึกฝนการจัดการข้อมูลเบื้องต้นโดยใช้ Excel

ตัวอย่างของข้อมูลเชิงโครงสร้าง (Examples of Structured Data)

ข้อมูลจากซอฟต์แวร์ Orange Data Mining

ข้อมูลจากซอฟต์แวร์ Orange Data Mining

Employee Attrition (2015) จาก IBM Watson Analytics
เป็นชุดข้อมูลสาธารณะที่ใช้กันอย่างแพร่หลายในการสาธิตการวิเคราะห์เชิงคาดการณ์ โดยเฉพาะการสร้างแบบจำลองการลาออกของพนักงาน (Employee Turnover Modeling) ซึ่งถูกเผยแพร่โดย IBM เพื่อสนับสนุนการเรียนรู้ด้านวิทยาศาสตร์ข้อมูลและการวิเคราะห์ทรัพยากรมนุษย์ (HR Analytics)

ข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data)

ข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data) หมายถึงข้อมูลที่ไม่ได้ถูกจัดระเบียบในรูปแบบที่กำหนดไว้ล่วงหน้า
เช่น ตารางใน ฐานข้อมูลเชิงสัมพันธ์ (Relational Database)
ซึ่งไม่สามารถจัดเรียงให้อยู่ในรูปของแถวและคอลัมน์ได้ง่าย

ลักษณะของข้อมูลที่ไม่มีโครงสร้าง

  • ไม่มีโครงสร้างตายตัว

  • ยากต่อการจัดเก็บและวิเคราะห์ด้วยวิธีดั้งเดิม

  • มักมีปริมาณมาก (Big Data)

ตัวอย่างของข้อมูลที่ไม่มีโครงสร้าง
(Examples of Unstructured Data)

  • ข้อมูลข้อความ (Text Data): เช่น อีเมล ข้อความในสื่อสังคมออนไลน์ บทความ ฯลฯ

  • ข้อมูลภาพและวิดีโอ (Images and Videos): เช่น ไฟล์ JPEG, PNG, MP4 หรือ MKV

  • ไฟล์เสียง (Audio Files): เช่น เสียงบันทึก พอดแคสต์ หรือไฟล์ MP3

  • ข้อมูลจากสื่อสังคมออนไลน์ (Social Media Data): เช่น โพสต์ ความคิดเห็น หรือทวีต

  • ข้อมูลจากเซนเซอร์และ IoT (Sensor and IoT Data): เช่น ข้อมูลจากกล้องวงจรปิด (CCTV) หรืออุปกรณ์ตรวจจับต่าง ๆ

ข้อดีและข้อเสียของข้อมูลที่ไม่มีโครงสร้าง
(Pros and Cons of Unstructured Data)

👍 ข้อดี (Pros)

  • ให้ข้อมูลเชิงลึกมากกว่าข้อมูลเชิงโครงสร้าง

  • มีประโยชน์ในการวิเคราะห์พฤติกรรมและแนวโน้มของผู้ใช้งาน

  • เป็นแหล่งข้อมูลสำคัญในยุคดิจิทัล (เช่น ด้านการตลาด สื่อสังคมออนไลน์ และปัญญาประดิษฐ์)

👎 ข้อเสีย (Cons)

  • ต้องใช้เทคโนโลยีขั้นสูงในการจัดเก็บและวิเคราะห์

  • ต้องการพื้นที่จัดเก็บข้อมูลขนาดใหญ่

  • มีความซับซ้อนในการประมวลผลและการดึงข้อมูลกลับมาใช้

ความแตกต่างหลัก 5 ประการระหว่างข้อมูลเชิงโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง

  1. ข้อมูลเชิงโครงสร้าง มีการกำหนดรูปแบบไว้อย่างชัดเจนและสามารถค้นหาได้ง่าย
    ในขณะที่ ข้อมูลที่ไม่มีโครงสร้าง มักถูกจัดเก็บในรูปแบบดิบ (Raw Data) หรือรูปแบบดั้งเดิม

  2. ข้อมูลเชิงโครงสร้าง มักเป็นข้อมูลเชิงปริมาณ (Quantitative)
    ส่วน ข้อมูลที่ไม่มีโครงสร้าง มักเป็นข้อมูลเชิงคุณภาพ (Qualitative)

  3. ข้อมูลเชิงโครงสร้าง มักถูกจัดเก็บไว้ใน Data Warehouse
    ขณะที่ ข้อมูลที่ไม่มีโครงสร้าง มักถูกจัดเก็บใน Data Lake

  4. ข้อมูลเชิงโครงสร้าง ค้นหาและวิเคราะห์ได้ง่ายกว่า
    แต่ ข้อมูลที่ไม่มีโครงสร้าง ต้องผ่านการประมวลผลและตีความเพิ่มเติม

  5. ข้อมูลเชิงโครงสร้าง มักบันทึกในไฟล์มาตรฐาน เช่น .txt, .csv, หรือ .xlsx
    ส่วน ข้อมูลที่ไม่มีโครงสร้าง มักอยู่ในรูปแบบที่หลากหลาย เช่น .doc, .pdf, .jpeg, .mov, .mp4, หรือ .wav

ข้อมูลกึ่งโครงสร้างคืออะไร? (What is Semi-Structured Data?)

ข้อมูลกึ่งโครงสร้าง (Semi-Structured Data) หมายถึงข้อมูลที่ ไม่ได้อยู่ในรูปแบบโครงสร้างดั้งเดิม ของฐานข้อมูลเชิงสัมพันธ์ (ข้อมูลเชิงโครงสร้าง (Structured Data))
แต่ยังคงมี องค์ประกอบการจัดระเบียบข้อมูลบางอย่าง เช่น แท็ก (tags) หรือ เมตาดาตา (metadata)
ซึ่งช่วยอธิบายลักษณะและความหมายของข้อมูลได้

ลักษณะของข้อมูลกึ่งโครงสร้าง (Characteristics of Semi-Structured Data)

  • มี โครงสร้างบางส่วน เช่น การใช้แท็ก (tags) หรือรูปแบบ คู่คีย์–ค่า (key-value pairs)

  • ไม่ได้จัดเรียงในรูปแบบตารางที่ชัดเจน แต่ยัง จัดการและวิเคราะห์ได้ง่ายกว่า ข้อมูลที่ไม่มีโครงสร้าง

  • มักถูกใช้ในระบบที่ต้องการ ความยืดหยุ่นในการจัดระเบียบข้อมูล

ตัวอย่างของข้อมูลกึ่งโครงสร้าง (Examples of Semi-Structured Data)

1. JSON (JavaScript Object Notation)

   {
       "name": "John Doe",
       "age": 30,
       "email": "johndoe@example.com"
   }
  • มีรูปแบบที่อ่านเข้าใจได้ง่ายและใช้โครงสร้างแบบคู่คีย์–ค่า (key-value structure)

  • มักถูกใช้ใน API และฐานข้อมูลแบบ NoSQL เช่น MongoDB

2. XML (eXtensible Markup Language)

   <person>
       <name>John Doe</name>
       <age>30</age>
       <email>johndoe@example.com</email>
   </person>
  • มักถูกใช้ในบริการบนเว็บ (Web Services) และใน เอกสารดิจิทัล (Digital Documents) เช่น RSS Feeds

3. Email

  • ส่วน ส่วนหัวของอีเมล (Header) เช่น ผู้ส่ง ผู้รับ และเวลาที่ส่ง มีโครงสร้างที่ชัดเจน

  • ส่วน เนื้อหาอีเมล (Body) อาจเป็นข้อความอิสระ (ข้อมูลที่ไม่มีโครงสร้าง)

4. NoSQL Databases (เช่น MongoDB, Cassandra)

{
    "_id": "60af924bd7c48b001c9f2b67",
    "name": "John Doe",
    "age": 30,
    "email": "johndoe@example.com",
    "address": {
        "street": "123 Main St",
        "city": "New York",
        "zip": "10001"
    },
    "hobbies": ["reading", "traveling", "music"]
}
  • ใช้สำหรับจัดเก็บข้อมูลในรูปแบบ JSON หรือโครงสร้างแบบเอกสาร (Document-Based Structure)

  • มีความยืดหยุ่นมากกว่าฐานข้อมูลเชิงสัมพันธ์ (SQL)

การประยุกต์ใช้ข้อมูลกึ่งโครงสร้าง (Applications of Semi-Structured Data)

  • บิ๊กดาต้าและคลาวด์สตอเรจ (Big Data & Cloud Storage): ใช้สำหรับจัดเก็บข้อมูลขนาดใหญ่ที่มีความยืดหยุ่นสูง

  • บริการเว็บและ API (Web Services & APIs): ใช้รูปแบบ JSON/XML เพื่อแลกเปลี่ยนข้อมูลระหว่างระบบ

  • การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ (Machine Learning & AI): ใช้จัดเก็บและประมวลผลข้อมูลที่มีโครงสร้างบางส่วน

ข้อดีและข้อเสียของข้อมูลกึ่งโครงสร้าง (Pros and Cons of Semi-Structured Data)

👍 ข้อดี (Pros)

  • มีความยืดหยุ่นมากกว่าข้อมูลเชิงโครงสร้าง
  • สามารถขยายหรือปรับเปลี่ยนโครงสร้างข้อมูลได้ง่าย
  • เหมาะสำหรับการจัดเก็บข้อมูลที่มีการเปลี่ยนแปลงบ่อย

👎 ข้อเสีย (Cons)

  • ยังคงต้องใช้วิธีการประมวลผลเฉพาะทาง เช่น ฐานข้อมูล NoSQL หรือการแปลงข้อมูล (Data Transformation)
  • มีความซับซ้อนมากกว่าข้อมูลเชิงโครงสร้างแบบดั้งเดิม

คลังข้อมูล (Data Warehouse) vs ทะเลสาบข้อมูล (Data Lake) vs เลคเฮาส์ข้อมูล (Data Lakehouse)

  • คลังข้อมูล (Data Warehouse): ใช้สำหรับจัดเก็บ ข้อมูลเชิงโครงสร้าง ที่ผ่านการประมวลผลและทำความสะอาดแล้ว เหมาะสำหรับการวิเคราะห์ทางธุรกิจ (Business Intelligence) และการสร้างรายงาน (Reporting)

  • ทะเลสาบข้อมูล (Data Lake): ใช้จัดเก็บข้อมูลทั้ง ที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้าง ในรูปแบบดิบ (Raw Data) เหมาะสำหรับงานด้าน Big Data, การวิเคราะห์เชิงลึก, และ Machine Learning

  • เลคเฮาส์ข้อมูล (Data Lakehouse): เป็นการผสมผสานจุดแข็งของ Data Warehouse และ Data Lake เข้าด้วยกัน โดยรองรับทั้งการจัดเก็บข้อมูลดิบและข้อมูลที่ผ่านการประมวลผล เพื่อให้สามารถทำทั้งการวิเคราะห์และการเรียนรู้ของเครื่องได้ในระบบเดียว

ประเภทของข้อมูลในทางสถิติ (Type of Data in Statistics)

ในทางสถิติมีประเภทของข้อมูลหลากหลายรูปแบบที่ถูกเก็บรวบรวม วิเคราะห์ ตีความ และนำเสนอ

ข้อมูล 4 ประเภทในสถิติ

ข้อมูล 4 ประเภทในสถิติ

ข้อมูลเชิงคุณภาพ (หรือข้อมูลเชิงประเภท) — Qualitative Data (or Categorical Data)

ข้อมูลเชิงคุณภาพ (Qualitative data) หรือที่เรียกว่า ข้อมูลเชิงประเภท (categorical data) หมายถึงข้อมูลที่ไม่ใช่ตัวเลข ใช้สำหรับจัดจำแนกหรือจัดหมวดหมู่สิ่งต่าง ๆ โดยมักแสดงในรูปของ คำ ข้อความ หรือสัญลักษณ์ ที่บรรยายลักษณะหรือคุณสมบัติ

ลักษณะสำคัญของข้อมูลเชิงคุณภาพ

  • ไม่สามารถคำนวณเป็นค่าตัวเลขได้โดยตรง

  • มักแสดงด้วยชื่อ หมวดหมู่ หรือป้ายกำกับ (labels)

ข้อมูลประเภทนี้ยังแบ่งย่อยได้เป็น 2 ประเภทหลัก ๆ คือ:

1. ข้อมูลนามบัญญัติ (Nominal Data)

ตัวอย่าง:

  • เพศ (Gender): ชาย, หญิง

  • สีของรถยนต์ (Car Color): แดง, น้ำเงิน, ขาว, ดำ

  • สัญชาติ (Nationality): ไทย, ญี่ปุ่น, อเมริกัน

  • ประเภทของสัตว์เลี้ยง (Type of Pet): สุนัข, แมว, นก, ปลา

ลักษณะสำคัญ:

  • ไม่มีลำดับหรือค่ามากน้อยในตัวเอง (เช่น สีแดงไม่ได้มากกว่าสีน้ำเงิน)

2. ข้อมูลลำดับขั้น (Ordinal Data)

ตัวอย่าง:

  • ระดับการศึกษา (Education Level): ประถมศึกษา, มัธยมศึกษา, ปริญญาตรี, ปริญญาโท

  • ระดับความพึงพอใจ (Satisfaction Level): ต่ำ, ปานกลาง, สูง

  • ระดับโรงแรม (Hotel Rating): 3 ดาว, 4 ดาว, 5 ดาว

  • ตำแหน่งงาน (Job Position): พนักงาน, ผู้จัดการ, ผู้บริหาร

ลักษณะสำคัญ:

  • มีลำดับขั้นของข้อมูลที่ชัดเจน แต่ไม่มีความแตกต่างเชิงปริมาณที่แน่นอนระหว่างแต่ละระดับ
    (เช่น ระดับ “สูง” ของความพึงพอใจไม่ได้หมายถึงมากกว่า “ปานกลาง” เป็นสองเท่า)

ข้อมูลเชิงปริมาณ (Quantitative Data หรือ Numerical Data)

ข้อมูลเชิงปริมาณ (Quantitative Data) หรือ ข้อมูลเชิงตัวเลข (Numerical Data)
หมายถึงข้อมูลที่สามารถ วัดหรือคำนวณได้โดยตรงด้วยตัวเลข

ข้อมูลประเภทนี้สามารถนำไปใช้ในการคำนวณทางคณิตศาสตร์และสถิติ เช่น
การหาค่าเฉลี่ย (mean), ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) หรือสัดส่วน (proportion)

ลักษณะของข้อมูลเชิงปริมาณ

  • แสดงในรูปของตัวเลขและสามารถนำไปใช้ในการคำนวณได้

  • สามารถ จัดอันดับ จัดลำดับ และเปรียบเทียบค่า กันได้

  • เหมาะสำหรับ การวิเคราะห์ทางสถิติ เช่น การหาค่ามัธยฐาน (median) และความแปรปรวน (variance)

ข้อมูลเชิงปริมาณสามารถแบ่งออกได้เป็น 2 ประเภทหลัก ได้แก่:

1. ข้อมูลไม่ต่อเนื่อง (Discrete Data)

  • ข้อมูลที่ประกอบด้วย จำนวนเต็ม หรือ ค่าที่นับได้
  • ไม่มีค่าที่อยู่ระหว่างตัวเลขสองค่า (เช่น 1, 2, 3, 4 …)

ตัวอย่าง: จำนวนคนในครอบครัว จำนวนรถที่ขายได้ จำนวนห้องในอาคาร

2. ข้อมูลต่อเนื่อง (Continuous Data)

  • ข้อมูลที่สามารถมี ค่าระหว่างตัวเลขได้ (เป็นข้อมูลที่วัดได้)

  • สามารถมี ทศนิยม หรือค่าที่มีความละเอียดมากขึ้นได้

ตัวอย่าง: น้ำหนัก ส่วนสูง อุณหภูมิ ระยะทาง รายได้

References