ซอฟต์แวร์สำหรับการทำเหมืองข้อมูลโดยไม่ต้องเขียนโปรแกรม

อ.ดร. สมศักดิ์ จันทร์เอม

วิทยาลัยนานาชาตินวัตกรรมดิจิทัล มหาวิทยาลัยเชียงใหม่

13 พฤศจิกายน 2568

🧰 เครื่องมือซอฟต์แวร์ทั้งหมดที่ใช้ในรายวิชานี้

Excel

Microsoft Excel คือโปรแกรมสเปรดชีตที่พัฒนาโดย Microsoft ใช้สำหรับ จัดเก็บข้อมูล, วิเคราะห์ข้อมูล, และ สร้างภาพข้อมูล ในรูปแบบ ตารางข้อมูล (Tabular Form)

Excel ใช้ทำอะไรได้บ้าง?

  • การจัดการข้อมูล (Data Management): เก็บข้อมูลในแถวและคอลัมน์

  • การคำนวณทางคณิตศาสตร์ (Mathematical Calculations): ใช้สูตร เช่น SUM, AVERAGE, IF

  • กราฟและแผนภูมิ (Charts & Graphs): สร้างกราฟแท่ง กราฟเส้น และอื่น ๆ

  • การวิเคราะห์ข้อมูล (Data Analysis): ใช้ PivotTable, Data Validation, Conditional Formatting

  • การทำงานอัตโนมัติ (Automation): ใช้ Macros และ VBA (Visual Basic for Applications) เพื่อทำงานซ้ำอัตโนมัติ

นามสกุลไฟล์ของ Excel

  • .xlsx: รูปแบบไฟล์มาตรฐาน

  • .xls: รูปแบบเดิม (ก่อนปี 2007)

  • .csv: ข้อมูลแบบข้อความ (comma-separated values)

Jamovi

https://www.jamovi.org/download.html

https://www.jamovi.org/download.html

Jamovi คือซอฟต์แวร์โอเพนซอร์สสำหรับการวิเคราะห์ทางสถิติ ใช้งานง่าย เหมือน SPSS แต่ ฟรี และ ทรงพลังมาก

คุณสมบัติเด่นของ Jamovi

  • อินเทอร์เฟซที่ใช้งานง่าย: หน้าตาคล้าย Excel และ SPSS

  • รองรับการวิเคราะห์สถิติ: เช่น t-test, ANOVA, regression, chi-square

  • การสร้างภาพข้อมูล (Visualization): มีกราฟแท่ง กราฟกระจาย ฮิสโตแกรม

  • รองรับภาษา R: ขยายฟังก์ชันด้วยโค้ด R ผ่านโมดูล Rj

  • ฟรีและโอเพนซอร์ส: ไม่ต้องเสียค่าลิขสิทธิ์

รูปแบบไฟล์ที่ Jamovi รองรับ

  • .omv: ไฟล์โปรเจกต์ของ Jamovi

  • สามารถนำเข้า .csv, .xlsx, .sav (SPSS), และ .txt

Orange Data Mining

https://orangedatamining.com/download/

https://orangedatamining.com/download/

Orange เป็นซอฟต์แวร์โอเพนซอร์สสำหรับ การวิเคราะห์ข้อมูล และ การทำเหมืองข้อมูล (Data Mining) ที่ใช้งานง่ายด้วยระบบลากวาง (drag-and-drop)

คุณสมบัติเด่นของ Orange

  • อินเทอร์เฟซแบบกราฟิก (GUI): ใช้งานได้โดยไม่ต้องเขียนโค้ด

  • การวิเคราะห์ข้อมูลขั้นสูง: เช่น clustering, PCA, classification

  • รองรับ Machine Learning: เช่น Decision Tree, SVM, Neural Network

  • การสร้างภาพข้อมูล (Visualization): มี scatter plot, heatmap, box plot

  • รองรับการเขียน Python Script: ใช้งานร่วมกับ scikit-learn, pandas

  • ฟรีและโอเพนซอร์ส: ใช้งานได้ทั้ง Windows, macOS, และ Linux

รูปแบบไฟล์ที่ Orange รองรับ

  • .csv, .xlsx – ข้อมูลแบบตาราง

  • .tab, .txt – ข้อความ

  • เชื่อมต่อฐานข้อมูล SQL ได้โดยตรง

เครื่องมือการเขียนโปรแกรมเพื่อพัฒนาทักษะด้านข้อมูล

ภาษา R และ Python เป็นภาษายอดนิยมสำหรับ การวิเคราะห์ข้อมูล, วิทยาศาสตร์ข้อมูล, และ ปัญญาประดิษฐ์ (AI/ML)

R คืออะไร

R เป็นภาษาสำหรับ สถิติและการวิเคราะห์ข้อมูล ที่ใช้กันแพร่หลายในแวดวงวิชาการและงานวิจัย

คุณสมบัติหลักของ R

เหมาะสำหรับงานสถิติและการวิเคราะห์ข้อมูล: มีแพ็กเกจครบ เช่น ggplot2, dplyr, tidyverse, caret

การสร้างภาพข้อมูลที่สวยงาม: ใช้ ggplot2 และ plotly

รองรับ Machine Learning และ AI: มี caret, mlr, randomForest

นิยมใช้ในงานวิจัย: เศรษฐศาสตร์ สังคมศาสตร์ ชีวสถิติ

รองรับการรายงานเชิงโต้ตอบ: ใช้งานร่วมกับ Quarto, R Markdown, Shiny

นามสกุลไฟล์ของ R

  • .R: สคริปต์ R

  • .Rmd: R Markdown

  • .qmd: Quarto Markdown

สามารถรันโค้ด R ได้

Python

Python คืออะไร

Python เป็นภาษาการเขียนโปรแกรมยอดนิยม ใช้งานได้หลากหลาย เช่น Data Science, AI/ML, Web Development, และ Automation

คุณสมบัติหลักของ Python

อ่านง่าย ใช้งานสะดวก: เหมาะสำหรับผู้เริ่มต้น

เหมาะกับงาน Machine Learning & AI: มีไลบรารี scikit-learn, TensorFlow, PyTorch

รองรับการวิเคราะห์ข้อมูลขั้นสูง: ใช้ pandas, numpy, matplotlib, seaborn

รองรับ Web Development: เช่น Flask, Django, FastAPI

มีคลังไลบรารีจำนวนมาก: เช่น OpenCV (ภาพ), NLTK, spaCy (NLP)

นามสกุลไฟล์ของ Python

  • .py: สคริปต์ Python

  • .ipynb: Jupyter Notebook

สามารถรันโค้ด Python ได้

R vs Python: การเปรียบเทียบ

คุณสมบัติ R 🟦 Python 🟧
การวิเคราะห์ข้อมูล ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐
การสร้างภาพข้อมูล ⭐⭐⭐⭐⭐ ⭐⭐⭐
การวิเคราะห์ทางสถิติ ⭐⭐⭐⭐⭐ ⭐⭐⭐
Machine Learning ⭐⭐⭐ ⭐⭐⭐⭐⭐
Deep Learning ⭐⭐ ⭐⭐⭐⭐⭐
Web Development ⭐⭐⭐⭐⭐
Big Data Integration ⭐⭐ ⭐⭐⭐⭐⭐
ความเหมาะกับผู้เริ่มต้น ⭐⭐⭐ ⭐⭐⭐⭐

ควรเลือกภาษาใดดี?

  • ถ้ามุ่งเน้น การวิเคราะห์ทางสถิติ หรือ งานวิจัย → ใช้ R

  • ถ้ามุ่งเน้น Machine Learning, AI, หรือ การพัฒนาแอปพลิเคชัน → ใช้ Python

  • หากต้องการใช้ ทั้งสองภาษา → สามารถเชื่อม R และ Python เข้าด้วยกันได้!