วันอาทิตย์ที่ 16 สิงหาคม พ.ศ. 2552

สหสัมพันธ์ การวิเคราะห์ถดถอย และผังการกระจาย
Correlation, Regression and Scatter Diagrams
เนื้อหาการวิเคราะห์ถดถอย

*
การวิเคราะห์ถดถอย (Regression Analysis)
*
การประมาณเส้นรีเกรซชั่น
*
ตัวอย่างการวิเคราะห์ถดถอย
*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย
* แบบฝึกหัด

*
การวิเคราะห์ถดถอย (Regression Analysis)

การวิเคราะห์ผังการกระจาย และสหสัมพันธ์ ทำให้เราทราบ แนวโน้มของความสัมพันธ์ xy อย่างกว้าง ๆ ว่าเป็นไปในทิศทางใด เช่น แปรตามกัน หรือแปรผกผันกัน
ถ้าเราต้องการทราบ รายละเอียดของความสัมพันธ์เป็นตัวเลข ที่อ่านได้ หรือวัดได้เลย เช่นในตัวอย่างถังพลาสติก ถ้าอยากทราบว่า ความดันเท่าไร ทำให้ผนังถัง มีความหนาเป็นเท่าไร เราจะต้องศึกษาลึกลงไปอีก

ในตัวอย่างเรื่องถังพลาสติก การศึกษานี้ ทำได้โดย ปรับค่าแรงดันลม แล้ววัดความหนาของถัง 4 ใบ ที่แรงดันลม 5 ระดับ จะได้ข้อมูลจำนวน 20 ข้อมูล (ตาราง 6.3)

ให้ค่า x เป็นแรงดันลมที่ใช้ และ y เป็นความหนาของถัง ซึ่งเป็นผลมาจากแรงดันลม
ดังนั้น

x คือ "ตัวแปรต้น*" (Independent Variable)
y คือ "ตัวแปรตาม*" (Dependent Variable)
* คำแปลจากพจนานุกรมศัพท์คณิตศาสตร์ ฉบับราชบัณฑิตยสถาน พ.ศ.2532

เขียนเป็นสมการ แสดงความสัมพันธ์ x กับ y ได้ดังนี้

Alpha คือ ค่าคงที่ (ค่า y เมื่อ x = 0 หรือจุดตัดแกน y, y-intercept)
Beta คือ ค่าความชัน (Slope) ของเส้นกราฟ หรือเรียกว่า สัมประสิทธิ์การถดถอย (Regression Coefficient)

เส้นตรงที่มีสมการเป็น เรียกว่า "เส้นการถดถอย" (Rgression Line)

ส่วนวิธีการเปลี่ยนผังการกระจาย ให้เป็นสมการที่ชัดเจน เรียกว่า "การวิเคราะห์ถดถอย" (Regression Analysis)

ตาราง 6.3 นำมาลงจุดเป็นกราฟ xy ได้ดังนี้ (รูป 6.8)

*
การประมาณเส้นการถดถอย

สมมติให้ข้อมูล (xi,yi) เป็นข้อมูลที่ทดลองมาได้ โดย
i มีค่าจาก 1 ถึง n และ
n คือจำนวนคู่ของข้อมูล และ
Alpha^ และ Beta^ คือค่าประมาณของ Alpha กับ Beta โดยมี
ei เป็นผลต่าง ของค่า yi กับค่า ( Alpha^ + Beta^ xi ) นั่นคือ...

*
ตัวอย่างการวิเคราะห์ถดถอย

นำข้อมูลจากตาราง 6.3 มาเป็น ตัวอย่าง การคำนวณหา เส้นการถดถอย ได้ดังนี้

จากสมการถดถอยที่ได้ หมายความว่า ทุกค่าแรงดันลม (x) ที่เพิ่มขึ้น 1 กก./ตร.ซม. มีผลให้ความหนาของถัง (y) บางลง 1.28 มม. เพราะเป็นลบ

เราสามารถคำนวณเส้นการถดถอย จากสมการได้ดังนี้

x = 8.0 , y = 14.80 - 1.28 (8.0) = 4.6
x = 8.5 , y = 14.80 - 1.28 (8.5) = 3.9
x = 9.0 , y = 14.80 - 1.28 (8.0) = 3.3
x = 9.5 , y = 14.80 - 1.28 (8.0) = 2.6
x = 10.0 , y = 14.80 - 1.28 (8.0) = 2.0

นำเส้นการถดถอยมาเขียนลงในกราฟรูป 6.8 โดยเส้นตรงจะผ่านกึ่งกลางของชุดข้อมูล แต่ละชุด (รูป 6.9)

*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย

1) อย่าวิเคราะห์การถดถอย หรือคำนวณเส้นการถดถอย โดยมีได้เขียน ผังการกระจาย เพราะ จะทำให้เกิด ความผิดพลาดได้

ตัวอย่างข้อมูล 4 ชุดแสดงในรูป 6.10.1 - 6.10.4 และตาราง 6.4

พิจารณารูป 6.10.1 ถึงรูป 6.10.4 ข้อมูลทั้ง 4 รูป แตกต่างกันอย่างชัดเจน แต่ให้สมการถดถอย ที่เหมือนกัน

หมายเหตุ
รูป 6.10.1 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นตรง
รูป 6.10.2 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นโค้ง
รูป 6.10.3 มีจุดแตกกลุ่มจุดหนึ่ง ควรตัดออกไม่คิด ข้อมูลที่เหลือ จึงเป็นเส้นตรง
รูป 6.10.4 ข้อมูลบนแกน x มีน้อยไป มีเพียง 2 ค่า คือที่ x = 8 และ x = 19 เท่านั้น

ตัวอย่างในตาราง 6.4 ข้อมูล 4 ชุดที่แตกต่างกัน แต่ได้ผลการคำนวณ เส้นสมการถดถอย ที่เหมือนกัน

ไม่มีความคิดเห็น:

แสดงความคิดเห็น