วันอาทิตย์ที่ 16 สิงหาคม พ.ศ. 2552

Code ตัวอย่างการวิเคราะห์สมการการถดถอยอย่างง่าย


ตัวอย่างการวิเคราะห์สมการการถดถอย จากข้อมูลความสูง c และน้ำหนัก d ของชายไทยที่สุ่มตัวอย่างมา 10 คน ดังนี้
ซี่งในกรณีนี้จะใช้ for loop ในการคำนวณ
c=[150 160 162 165 170 175 175 178 180 185];
d=[50 61 68 73 77 82 84 89 91 98];
n=10;
for i= 1
p=b(c,d,n);
q=a(c,d,p);
z=reg(q,p,c);
plot(c,d,'ob')
hold on
plot(c,z,'-r')
end
outputที่ได้จากการวิเคราะห์การถดถอยอย่างง่ายจะแสดงผลออกมาในรูปของกราฟเส้นตรง

ตัวอย่าง while loop ที่ใช้คำนวณ
c=[150 160 162 165 170 175 175 178 180 185];
d=[50 61 68 73 77 82 84 89 91 98];
n=10;
i=0;
while (i==0)
p=b(c,d,n);
q=a(c,d,p);
z=reg(q,p,c);
plot(c,d,'ob')
hold on
plot(c,z,'-r')
i=i+1;
end
ผลที่แสดงออกมาก็จะเหมือนกับ for loop
โดย ฟังก์ชันหลักที่ใช้ในการคำนวณถ้าหากเป็นข้อมูลใดๆจะได้เป็น
function reg=reg(a,b,x)
reg=a+(b.*x)

function a=a(x,y,b)
a=mean(y)-b.*mean(x)

function b=b(x,y,n)
b=(sum(x.*y)-(sum(x).*sum(y))./n)./(sum(x.^2)-(sum(x)^2)./n)

x=[x1 x2 x3 ... xn];
y=[y1 y2 y3 ... yn];
n=จำนวนข้อมูล;
for i= 1
p=b(x,y,n);
q=a(x,y,p);
z=reg(q,p,x);
plot(x,y,'ob')
hold on
plot(x,z,'-r')
end

Correlation, Regression and Scatter Diagrams

สหสัมพันธ์ การวิเคราะห์ถดถอย และผังการกระจาย
Correlation, Regression and Scatter Diagrams
เนื้อหาการวิเคราะห์ถดถอย

*
การวิเคราะห์ถดถอย (Regression Analysis)
*
การประมาณเส้นรีเกรซชั่น
*
ตัวอย่างการวิเคราะห์ถดถอย
*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย
* แบบฝึกหัด

*
การวิเคราะห์ถดถอย (Regression Analysis)

การวิเคราะห์ผังการกระจาย และสหสัมพันธ์ ทำให้เราทราบ แนวโน้มของความสัมพันธ์ xy อย่างกว้าง ๆ ว่าเป็นไปในทิศทางใด เช่น แปรตามกัน หรือแปรผกผันกัน
ถ้าเราต้องการทราบ รายละเอียดของความสัมพันธ์เป็นตัวเลข ที่อ่านได้ หรือวัดได้เลย เช่นในตัวอย่างถังพลาสติก ถ้าอยากทราบว่า ความดันเท่าไร ทำให้ผนังถัง มีความหนาเป็นเท่าไร เราจะต้องศึกษาลึกลงไปอีก

ในตัวอย่างเรื่องถังพลาสติก การศึกษานี้ ทำได้โดย ปรับค่าแรงดันลม แล้ววัดความหนาของถัง 4 ใบ ที่แรงดันลม 5 ระดับ จะได้ข้อมูลจำนวน 20 ข้อมูล (ตาราง 6.3)

ให้ค่า x เป็นแรงดันลมที่ใช้ และ y เป็นความหนาของถัง ซึ่งเป็นผลมาจากแรงดันลม
ดังนั้น

x คือ "ตัวแปรต้น*" (Independent Variable)
y คือ "ตัวแปรตาม*" (Dependent Variable)
* คำแปลจากพจนานุกรมศัพท์คณิตศาสตร์ ฉบับราชบัณฑิตยสถาน พ.ศ.2532

เขียนเป็นสมการ แสดงความสัมพันธ์ x กับ y ได้ดังนี้

Alpha คือ ค่าคงที่ (ค่า y เมื่อ x = 0 หรือจุดตัดแกน y, y-intercept)
Beta คือ ค่าความชัน (Slope) ของเส้นกราฟ หรือเรียกว่า สัมประสิทธิ์การถดถอย (Regression Coefficient)

เส้นตรงที่มีสมการเป็น เรียกว่า "เส้นการถดถอย" (Rgression Line)

ส่วนวิธีการเปลี่ยนผังการกระจาย ให้เป็นสมการที่ชัดเจน เรียกว่า "การวิเคราะห์ถดถอย" (Regression Analysis)

ตาราง 6.3 นำมาลงจุดเป็นกราฟ xy ได้ดังนี้ (รูป 6.8)

*
การประมาณเส้นการถดถอย

สมมติให้ข้อมูล (xi,yi) เป็นข้อมูลที่ทดลองมาได้ โดย
i มีค่าจาก 1 ถึง n และ
n คือจำนวนคู่ของข้อมูล และ
Alpha^ และ Beta^ คือค่าประมาณของ Alpha กับ Beta โดยมี
ei เป็นผลต่าง ของค่า yi กับค่า ( Alpha^ + Beta^ xi ) นั่นคือ...

*
ตัวอย่างการวิเคราะห์ถดถอย

นำข้อมูลจากตาราง 6.3 มาเป็น ตัวอย่าง การคำนวณหา เส้นการถดถอย ได้ดังนี้

จากสมการถดถอยที่ได้ หมายความว่า ทุกค่าแรงดันลม (x) ที่เพิ่มขึ้น 1 กก./ตร.ซม. มีผลให้ความหนาของถัง (y) บางลง 1.28 มม. เพราะเป็นลบ

เราสามารถคำนวณเส้นการถดถอย จากสมการได้ดังนี้

x = 8.0 , y = 14.80 - 1.28 (8.0) = 4.6
x = 8.5 , y = 14.80 - 1.28 (8.5) = 3.9
x = 9.0 , y = 14.80 - 1.28 (8.0) = 3.3
x = 9.5 , y = 14.80 - 1.28 (8.0) = 2.6
x = 10.0 , y = 14.80 - 1.28 (8.0) = 2.0

นำเส้นการถดถอยมาเขียนลงในกราฟรูป 6.8 โดยเส้นตรงจะผ่านกึ่งกลางของชุดข้อมูล แต่ละชุด (รูป 6.9)

*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย

1) อย่าวิเคราะห์การถดถอย หรือคำนวณเส้นการถดถอย โดยมีได้เขียน ผังการกระจาย เพราะ จะทำให้เกิด ความผิดพลาดได้

ตัวอย่างข้อมูล 4 ชุดแสดงในรูป 6.10.1 - 6.10.4 และตาราง 6.4

พิจารณารูป 6.10.1 ถึงรูป 6.10.4 ข้อมูลทั้ง 4 รูป แตกต่างกันอย่างชัดเจน แต่ให้สมการถดถอย ที่เหมือนกัน

หมายเหตุ
รูป 6.10.1 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นตรง
รูป 6.10.2 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นโค้ง
รูป 6.10.3 มีจุดแตกกลุ่มจุดหนึ่ง ควรตัดออกไม่คิด ข้อมูลที่เหลือ จึงเป็นเส้นตรง
รูป 6.10.4 ข้อมูลบนแกน x มีน้อยไป มีเพียง 2 ค่า คือที่ x = 8 และ x = 19 เท่านั้น

ตัวอย่างในตาราง 6.4 ข้อมูล 4 ชุดที่แตกต่างกัน แต่ได้ผลการคำนวณ เส้นสมการถดถอย ที่เหมือนกัน

สหสัมพันธ์ การวิเคราะห์ถดถอย และผังการกระจาย
Correlation, Regression and Scatter Diagrams
เนื้อหาการวิเคราะห์ถดถอย

*
การวิเคราะห์ถดถอย (Regression Analysis)
*
การประมาณเส้นรีเกรซชั่น
*
ตัวอย่างการวิเคราะห์ถดถอย
*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย
* แบบฝึกหัด

*
การวิเคราะห์ถดถอย (Regression Analysis)

การวิเคราะห์ผังการกระจาย และสหสัมพันธ์ ทำให้เราทราบ แนวโน้มของความสัมพันธ์ xy อย่างกว้าง ๆ ว่าเป็นไปในทิศทางใด เช่น แปรตามกัน หรือแปรผกผันกัน
ถ้าเราต้องการทราบ รายละเอียดของความสัมพันธ์เป็นตัวเลข ที่อ่านได้ หรือวัดได้เลย เช่นในตัวอย่างถังพลาสติก ถ้าอยากทราบว่า ความดันเท่าไร ทำให้ผนังถัง มีความหนาเป็นเท่าไร เราจะต้องศึกษาลึกลงไปอีก

ในตัวอย่างเรื่องถังพลาสติก การศึกษานี้ ทำได้โดย ปรับค่าแรงดันลม แล้ววัดความหนาของถัง 4 ใบ ที่แรงดันลม 5 ระดับ จะได้ข้อมูลจำนวน 20 ข้อมูล (ตาราง 6.3)

ให้ค่า x เป็นแรงดันลมที่ใช้ และ y เป็นความหนาของถัง ซึ่งเป็นผลมาจากแรงดันลม
ดังนั้น

x คือ "ตัวแปรต้น*" (Independent Variable)
y คือ "ตัวแปรตาม*" (Dependent Variable)
* คำแปลจากพจนานุกรมศัพท์คณิตศาสตร์ ฉบับราชบัณฑิตยสถาน พ.ศ.2532

เขียนเป็นสมการ แสดงความสัมพันธ์ x กับ y ได้ดังนี้

Alpha คือ ค่าคงที่ (ค่า y เมื่อ x = 0 หรือจุดตัดแกน y, y-intercept)
Beta คือ ค่าความชัน (Slope) ของเส้นกราฟ หรือเรียกว่า สัมประสิทธิ์การถดถอย (Regression Coefficient)

เส้นตรงที่มีสมการเป็น เรียกว่า "เส้นการถดถอย" (Rgression Line)

ส่วนวิธีการเปลี่ยนผังการกระจาย ให้เป็นสมการที่ชัดเจน เรียกว่า "การวิเคราะห์ถดถอย" (Regression Analysis)

ตาราง 6.3 นำมาลงจุดเป็นกราฟ xy ได้ดังนี้ (รูป 6.8)

*
การประมาณเส้นการถดถอย

สมมติให้ข้อมูล (xi,yi) เป็นข้อมูลที่ทดลองมาได้ โดย
i มีค่าจาก 1 ถึง n และ
n คือจำนวนคู่ของข้อมูล และ
Alpha^ และ Beta^ คือค่าประมาณของ Alpha กับ Beta โดยมี
ei เป็นผลต่าง ของค่า yi กับค่า ( Alpha^ + Beta^ xi ) นั่นคือ...

*
ตัวอย่างการวิเคราะห์ถดถอย

นำข้อมูลจากตาราง 6.3 มาเป็น ตัวอย่าง การคำนวณหา เส้นการถดถอย ได้ดังนี้

จากสมการถดถอยที่ได้ หมายความว่า ทุกค่าแรงดันลม (x) ที่เพิ่มขึ้น 1 กก./ตร.ซม. มีผลให้ความหนาของถัง (y) บางลง 1.28 มม. เพราะเป็นลบ

เราสามารถคำนวณเส้นการถดถอย จากสมการได้ดังนี้

x = 8.0 , y = 14.80 - 1.28 (8.0) = 4.6
x = 8.5 , y = 14.80 - 1.28 (8.5) = 3.9
x = 9.0 , y = 14.80 - 1.28 (8.0) = 3.3
x = 9.5 , y = 14.80 - 1.28 (8.0) = 2.6
x = 10.0 , y = 14.80 - 1.28 (8.0) = 2.0

นำเส้นการถดถอยมาเขียนลงในกราฟรูป 6.8 โดยเส้นตรงจะผ่านกึ่งกลางของชุดข้อมูล แต่ละชุด (รูป 6.9)

*
ข้อสังเกตเกี่ยวกับการวิเคราะห์ถดถอย

1) อย่าวิเคราะห์การถดถอย หรือคำนวณเส้นการถดถอย โดยมีได้เขียน ผังการกระจาย เพราะ จะทำให้เกิด ความผิดพลาดได้

ตัวอย่างข้อมูล 4 ชุดแสดงในรูป 6.10.1 - 6.10.4 และตาราง 6.4

พิจารณารูป 6.10.1 ถึงรูป 6.10.4 ข้อมูลทั้ง 4 รูป แตกต่างกันอย่างชัดเจน แต่ให้สมการถดถอย ที่เหมือนกัน

หมายเหตุ
รูป 6.10.1 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นตรง
รูป 6.10.2 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นโค้ง
รูป 6.10.3 มีจุดแตกกลุ่มจุดหนึ่ง ควรตัดออกไม่คิด ข้อมูลที่เหลือ จึงเป็นเส้นตรง
รูป 6.10.4 ข้อมูลบนแกน x มีน้อยไป มีเพียง 2 ค่า คือที่ x = 8 และ x = 19 เท่านั้น

ตัวอย่างในตาราง 6.4 ข้อมูล 4 ชุดที่แตกต่างกัน แต่ได้ผลการคำนวณ เส้นสมการถดถอย ที่เหมือนกัน

การวิเคราะห์การถดถอยอย่างง่าย

การวิเคราะห์ความถดถอย (Regression Analysis)

-เป็นวิธีการทางสถิติที่ใช้สร้างสมการเส้นตรงหรือเส้นโค้งที่แสดงความสัมพันธ์ระหว่างตัวแปรสองตัวหรือมากกว่า ซึ่งประกอบตัวแปรตามหนึ่งตัว(dependent variable) กับตัวแปรอิสระอย่างน้อยหนึ่งตัว(independent variable)

-เช่น ค่าความแข็ง(hardness)ของพลาสติกขึ้นอยู่กับระยะเวลาที่ให้ความร้อนกับพลาสติก ในที่นี้ตัวแปรอิสระ(X) คือระยะเวลาให้ความร้อน ส่วนตัวแปรตาม(Y) คือค่าความแข็งของพลาสติก

-การวิเคราะห์ความถดถอยมี 2 ประเภทคือ การถดถอยอย่างง่าย (Simple Regression) และการถดถอยพหุคูณ (Multiple Regression)

-การการวิเคราะห์ความการถดถอยสามารถนำไปใช้ในการสร้างโมเดลสำหรับการพยากรณ์ค่าของตัวแปรตาม

การถดถอยเชิงเส้นอย่างง่าย (Simple Linear Regression)

-เป็นการวิเคราะห์ความสัมพันธ์ของ 2 ตัวแปร คือตัวแปรอิสระหนึ่งตัว และตัวแปรตามหนึ่งตัว

-ความสัมพันธ์ของตัวแปรทั้งสองเป็นลักษณะเชิงเส้นตรง

-สมมติว่า ค่าเฉลี่ยของตัวแปรตาม y มีความสัมพันธ์เชิงเส้นตรงกับตัวแปรอิสระ x

สมการการถดถอยอย่างง่ายคือ

y = b0+b1X+c

เมื่อ C คืิอ ค่าความคลาดเคลื่อน

วันพฤหัสบดีที่ 9 กรกฎาคม พ.ศ. 2552

MATLAB

คู่มือการใช้ Matlab เบื้องต้นครับ
http://www.mediafire.com/?60ihgebxpez