ผู้เขียนอยากจะยกตัวอย่างให้เห็นภาพวิธีการนำไปประยุกต์ใช้งาน ซึ่งจริงๆเวลาใช้งาน เรามักจะใช้ Software ช่วยในการคำนวณ ขั้นตอนก็จะรวบรัดมากกว่าที่ได้กล่าวในหัวข้อที่ผ่านมา นั่นเพราะว่าในการนำทฤษฎีอะไรก็ตามไปใช้งานจริงๆ เราก็ไม่จำเป็นต้องแสดงวิธีคิด หรือขั้นตอนอย่างละเอียด แต่นั่นต้องพึงระลึกอยู่เสมอว่า เราต้องมีความเข้าใจในทฤษฎี ซึ่งจะทำให้เราเข้าใจเหตุและผลของสิ่งที่ได้

ตัวอย่าง นักวิจัยการตลาดคนหนึ่งกำลังสำรวจข้อมูล ราคาเช่าต่อเดือนของอาคารชุดประเภทคอนโดมิเนี่ยม ในเขตใกล้เคียงกับถนนศรีนครินทร์ ในช่วงที่อยู่ในเขตกรุงเทพมหานคร โดยการสำรวจได้เก็บตัวอย่าง โดยใช้อัตราค่าเช่าห้องต่อเดือน และขนาดของห้อง เป็นเกณฑ์ โดยได้ข้อมูลมาดังตารางต่อไปนี้ (ตัวเลขสมมติ)

เมื่อเราได้ข้อมูลมาดังในตาราง เราจะเริ่มการพิสูจน์ข้อมูลโดยใช้กราฟ Scatter plot


Credits go to:

https://sites.google.com/site/mystatistics01/regression-correlation-analysis?fbclid=IwAR2VfpUF5LuWGS5mW76nPkDidfZyrQFdxKlG2kMbHlZPIFJnZdxvv_Xi508

ตัวอย่างการคำนวณ Simple Linear Regression Analysis

ตัวอย่าง คณะนักวิจัยที่ทำการศึกษาเกี่ยวกับชีวิตของหมีป่าต้องการหาวิธีการจะประมาณค่าน้ำหนักของหมีที่อาศัยอยู่ตามธรรมชาติในป่า โดยมีจุดประสงค์ที่สำคัญคือในอนาคตข้างหน้านักวิจัยกลุ่มนี้ไม่ต้องการใช้เครื่องชั่งน้ำหนักในการทำการศึกษาเกี่ยวกับชีวิตหมีอีก ทั้งนี้เพราะมีความลำบากในการขนย้าย จึงทำการออกสำรวจกลุ่มตัวอย่างหมีป่า 10 ตัว หลากหลายขนาด ทั้งเพศผู้และเพศเมีย แล้วทำการชั่งน้ำหนักและวัดความยาวรอบอกบริเวณราวนมของหมีป่า ทั้ง 10 ตัว ได้ข้อมูลดังตารางต่อไปนี้

เมื่อมีตัวแปรต้นและตัวแปรตามเพียงอย่างละ 1 ตัวแปร สมการหรือ Model ที่ได้จะเป็นดังนี้


credit goes to

https://sites.google.com/site/mystatistics01/regression-correlation-analysis?fbclid=IwAR2VfpUF5LuWGS5mW76nPkDidfZyrQFdxKlG2kMbHlZPIFJnZdxvv_Xi508

ชื่อก็บอกอยู่แล้วว่าง่ายและไม่ซับซ้อนที่สุดในส่วนของ Regression analysis โดยแท้จริงแล้วก็คือ Regression ที่มี ตัวแปรที่เรารู้ค่า (Predictor) และตัวแปรที่เราไม่รู้ค่า (Response) อย่างละ 1 ตัวเท่านั้น ผู้เขียนขอเริ่มเข้าสู่เนื้อหาโดยการเริ่มวิเคราะห์ตัวอย่างให้เห็นภาพ และพื้นฐาน ที่ไปที่มา ของ Regression ก่อน ผู้เขียนเชื่อว่าตำราหลายๆตำราเกี่ยวกับเรื่อง Regression นี้ จะเริ่มด้วยการหาสมการ ซึ่งผู้เขียนเห็นว่า ข้อเสียของวิธีนี้คือผู้อ่านจะไม่เข้าใจว่าทำไมถึงได้สมการแบบนั้น มันมีขั้นตอนหรือหลักการคิดมาได้อย่างไร

ก่อนอื่นเราต้องทำความเข้าใจก่อนว่า จุดประสงค์ของการใช้ Regression Analysis ก็เพื่อต้องการหาสมการความสัมพันธ์ ( Transfer function ) ของตัวแปรฝั่งที่เรารู้ค่า ( Predictor ) กับฝั่งที่เราไม่รู้ค่า (Response) เพื่อที่จะนำไปสู่การคาดการณ์หรือประมาณค่า ของตัวแปรที่เราไม่รู้ค่าได้ในที่สุด และที่สำคัญการจะนำสมการความสัมพันธ์ไปใช้ได้ จะต้องมีการตรวจสอบเสียก่อนว่าสมการที่ได้มานั้นมีความถูกต้อง พอที่จะใช้เป็นสมการในการคาดการตัวแปรที่ไม่รู้ค่าได้จริงหรือไม่…


ท่านผู้อ่านหลายท่านคงจะเคยได้อ่านคำแปลภาษาไทยของคำนี้ว่า “การวิเคราะห์การถดถอย” ถึงแม้คำแปลนี้จะเป็นที่รับรู้ในภาษาไทยมานานแล้ว แต่โดยส่วนตัวแล้วผมคิดว่าเป็นคำแปลที่ทำให้ผู้อ่านรู้สึกหดหู่พิกล แต่ผู้เขียนก็ไม่ได้บอกว่าคำที่ใช้ในปัจจุบันไม่ถูกต้อง และที่ถูกต้องควรจะใช้คำว่าอะไร เพียงแต่อยากให้ท่านผู้อ่านลองอ่านเนื้อหาเบื้องต้นดูก่อน แล้วจะทราบว่า คำว่า Regess นั้นที่ถูกแล้วภาษาไทยเราควรจะใช้คำว่า “ ถดถอย” หรือไม่

ท่านผู้อ่านเคยมีคำถามในใจคล้ายๆกับคำถามต่อไปนี้บ้างหรือไม่

1. เปิดเครื่องปรับอากาศ วันละ 5 ชั่วโมง เดือนนี้จ่ายค่าไฟ 560 บาท ถ้าอยากจ่ายเดือนละ 450 บาท หรือน้อยกว่าควรจะเปิดวันละกี่ชั่วโมง (อุปกรณ์อย่างอื่นใช้เหมือนปกติ)

2. ถ้าขับรถด้วยความเร็วเฉลี่ย 90 กิโลเมตรต่อชั่วโมง เติมน้ำมันเต็มถังจะวิ่งรถได้รวม 560 กิโลเมตร ถ้าขับที่ความเร็วเฉลี่ย 110 กิโลเมตรต่อชั่วโมง จะวิ่งได้กี่ กิโลเมตร แล้วถ้าเป็น 130 กิโลเมตรต่อชั่วโมง จะได้กี่กิโลเมตร ถ้าเติมน้ำมันเต็มถังเหมือนกัน

3. …


Machine Learning, ML, พาเข้าสู่ Technology ที่น่าสนใจทั้งด้านการศึกษาและอุตสาหกรรม ทุกๆวันที่ผ่านไป ML ได้เติบโตเข้าสู่การผูกมัดที่ซับซ้อนของ Application ต่างๆ เช่น image, speech recognition, pattern recognition, optimization, natural language processing, and recommendations, และอื่นๆ อีกมากมาย

Programming computers to learn from experience should eventually eliminate the need for much of this detailed programming effort. — Arthur Samuel 1959.

Machine Learning ถูกแบ่งออกมาได้ 4 Techniques:

Regression, Classification, Clustering, and Reinforcement Learning

ทั้ง 4 Techniques ได้นำมาสู่การแก้ปัญหาที่เกิดจากหลักธรรมชาติทั่วไป โดยอาศัยหลักใหญ่ๆ 2 รูปแบบ: Supervised และ Unsupervised Learning. Supervised Learning ต้องอาศัย data ที่ถูก Label และ Prepared ล่วงหน้า ส่วน Unsupervised Learning จะใช้งานกับ unlabeled data หรือ data ที่ไม่มี characteristic บทความนี้ไม่ได้อธิบาย Concept ของ ML หรือ ชี้ทางไปยังคำอธิบายในเชิงลึกของ Terms ต่างๆของ ML

Machine Learning Libraries in Java

Library ของ Java สำหรับ coding Machine Learning ที่นิยมกันตามด้านล่าง

References: https://towardsdatascience.com/machine-learning-in-java-e335b9d80c14

Pera Kajonpotisuwan

Thai people, having a master degree from Canada University

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store