สหสัมพันธ์ การวิเคราะห์ถดถอย และผังการกระจาย
Correlation, Regression and Scatter Diagrams
เนื้อหาการวิเคราะห์ถดถอย
*
การวิเคราะห์ถดถอย (Regression Analysis)
*
การประมาณเส้นรีเกรซชั่น
*
ตัวอย่างการวิเคราะห์ถดถอย
*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย
* แบบฝึกหัด
*
การวิเคราะห์ถดถอย (Regression Analysis)
การวิเคราะห์ผังการกระจาย และสหสัมพันธ์ ทำให้เราทราบ แนวโน้มของความสัมพันธ์ xy อย่างกว้าง ๆ ว่าเป็นไปในทิศทางใด เช่น แปรตามกัน หรือแปรผกผันกัน
ถ้าเราต้องการทราบ รายละเอียดของความสัมพันธ์เป็นตัวเลข ที่อ่านได้ หรือวัดได้เลย เช่นในตัวอย่างถังพลาสติก ถ้าอยากทราบว่า ความดันเท่าไร ทำให้ผนังถัง มีความหนาเป็นเท่าไร เราจะต้องศึกษาลึกลงไปอีก
ในตัวอย่างเรื่องถังพลาสติก การศึกษานี้ ทำได้โดย ปรับค่าแรงดันลม แล้ววัดความหนาของถัง 4 ใบ ที่แรงดันลม 5 ระดับ จะได้ข้อมูลจำนวน 20 ข้อมูล (ตาราง 6.3)
ให้ค่า x เป็นแรงดันลมที่ใช้ และ y เป็นความหนาของถัง ซึ่งเป็นผลมาจากแรงดันลม
ดังนั้น
x คือ "ตัวแปรต้น*" (Independent Variable)
y คือ "ตัวแปรตาม*" (Dependent Variable)
* คำแปลจากพจนานุกรมศัพท์คณิตศาสตร์ ฉบับราชบัณฑิตยสถาน พ.ศ.2532
เขียนเป็นสมการ แสดงความสัมพันธ์ x กับ y ได้ดังนี้
Alpha คือ ค่าคงที่ (ค่า y เมื่อ x = 0 หรือจุดตัดแกน y, y-intercept)
Beta คือ ค่าความชัน (Slope) ของเส้นกราฟ หรือเรียกว่า สัมประสิทธิ์การถดถอย (Regression Coefficient)
เส้นตรงที่มีสมการเป็น เรียกว่า "เส้นการถดถอย" (Rgression Line)
ส่วนวิธีการเปลี่ยนผังการกระจาย ให้เป็นสมการที่ชัดเจน เรียกว่า "การวิเคราะห์ถดถอย" (Regression Analysis)
ตาราง 6.3 นำมาลงจุดเป็นกราฟ xy ได้ดังนี้ (รูป 6.8)
*
การประมาณเส้นการถดถอย
สมมติให้ข้อมูล (xi,yi) เป็นข้อมูลที่ทดลองมาได้ โดย
i มีค่าจาก 1 ถึง n และ
n คือจำนวนคู่ของข้อมูล และ
Alpha^ และ Beta^ คือค่าประมาณของ Alpha กับ Beta โดยมี
ei เป็นผลต่าง ของค่า yi กับค่า ( Alpha^ + Beta^ xi ) นั่นคือ...
*
ตัวอย่างการวิเคราะห์ถดถอย
นำข้อมูลจากตาราง 6.3 มาเป็น ตัวอย่าง การคำนวณหา เส้นการถดถอย ได้ดังนี้
จากสมการถดถอยที่ได้ หมายความว่า ทุกค่าแรงดันลม (x) ที่เพิ่มขึ้น 1 กก./ตร.ซม. มีผลให้ความหนาของถัง (y) บางลง 1.28 มม. เพราะเป็นลบ
เราสามารถคำนวณเส้นการถดถอย จากสมการได้ดังนี้
x = 8.0 , y = 14.80 - 1.28 (8.0) = 4.6
x = 8.5 , y = 14.80 - 1.28 (8.5) = 3.9
x = 9.0 , y = 14.80 - 1.28 (8.0) = 3.3
x = 9.5 , y = 14.80 - 1.28 (8.0) = 2.6
x = 10.0 , y = 14.80 - 1.28 (8.0) = 2.0
นำเส้นการถดถอยมาเขียนลงในกราฟรูป 6.8 โดยเส้นตรงจะผ่านกึ่งกลางของชุดข้อมูล แต่ละชุด (รูป 6.9)
*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย
1) อย่าวิเคราะห์การถดถอย หรือคำนวณเส้นการถดถอย โดยมีได้เขียน ผังการกระจาย เพราะ จะทำให้เกิด ความผิดพลาดได้
ตัวอย่างข้อมูล 4 ชุดแสดงในรูป 6.10.1 - 6.10.4 และตาราง 6.4
พิจารณารูป 6.10.1 ถึงรูป 6.10.4 ข้อมูลทั้ง 4 รูป แตกต่างกันอย่างชัดเจน แต่ให้สมการถดถอย ที่เหมือนกัน
หมายเหตุ
รูป 6.10.1 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นตรง
รูป 6.10.2 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นโค้ง
รูป 6.10.3 มีจุดแตกกลุ่มจุดหนึ่ง ควรตัดออกไม่คิด ข้อมูลที่เหลือ จึงเป็นเส้นตรง
รูป 6.10.4 ข้อมูลบนแกน x มีน้อยไป มีเพียง 2 ค่า คือที่ x = 8 และ x = 19 เท่านั้น
ตัวอย่างในตาราง 6.4 ข้อมูล 4 ชุดที่แตกต่างกัน แต่ได้ผลการคำนวณ เส้นสมการถดถอย ที่เหมือนกัน