ปัจจัยความแปรปรวนของอัตราเงินเฟ้อ (VIF) - ภาพรวมสูตรการใช้งาน

Variance Inflation Factor (VIF) วัดความรุนแรงของ multicollinearity ในการวิเคราะห์การถดถอยการวิเคราะห์การถดถอยการวิเคราะห์การถดถอยการวิเคราะห์การถดถอยเป็นชุดของวิธีการทางสถิติที่ใช้สำหรับการประมาณความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระอย่างน้อยหนึ่งตัว สามารถใช้เพื่อประเมินความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรและเพื่อสร้างแบบจำลองความสัมพันธ์ในอนาคตระหว่างตัวแปรเหล่านี้ . เป็นแนวคิดทางสถิติที่บ่งชี้ถึงการเพิ่มขึ้นของความแปรปรวนของค่าสัมประสิทธิ์การถดถอยอันเป็นผลมาจากการเรียงตัวกัน

ปัจจัยความแปรปรวนของอัตราเงินเฟ้อ

สรุป

  • Variance Inflation Factor (VIF) ใช้เพื่อตรวจจับความรุนแรงของ multicollinearity ในการวิเคราะห์การถดถอยกำลังสองน้อยที่สุด
  • Multicollinearity เพิ่มความแปรปรวนและข้อผิดพลาดประเภท II ทำให้ค่าสัมประสิทธิ์ของตัวแปรสอดคล้องกัน แต่ไม่น่าเชื่อถือ
  • VIF วัดจำนวนความแปรปรวนที่สูงเกินจริงที่เกิดจากความสัมพันธ์หลายมิติ

ปัจจัยความแปรปรวนของอัตราเงินเฟ้อและความหลากหลายเชิงเส้น

ในการวิเคราะห์การถดถอยกำลังสองน้อยที่สุด (OLS) ความสามารถในการเกิดเส้นตรงจะเกิดขึ้นเมื่อตัวแปรอิสระสองตัวขึ้นไปตัวแปรอิสระตัวแปรอิสระคืออินพุตสมมติฐานหรือตัวขับเคลื่อนที่เปลี่ยนแปลงเพื่อประเมินผลกระทบที่มีต่อตัวแปรตาม (ผลลัพธ์) . แสดงให้เห็นถึงความสัมพันธ์เชิงเส้นระหว่างพวกเขา ตัวอย่างเช่นในการวิเคราะห์ความสัมพันธ์ของขนาด บริษัท และรายได้กับราคาหุ้นในรูปแบบการถดถอยมูลค่าหลักทรัพย์ตามราคาตลาดและรายได้เป็นตัวแปรอิสระ

มูลค่าหลักทรัพย์ตามราคาตลาดของ บริษัท มูลค่าหลักทรัพย์ตามราคาตลาด (Market Cap) คือมูลค่าตลาดล่าสุดของหุ้นที่โดดเด่นของ บริษัท Market Cap เท่ากับราคาหุ้นปัจจุบันคูณด้วยจำนวนหุ้นที่ออกจำหน่าย ชุมชนการลงทุนมักใช้มูลค่าหลักทรัพย์ตามราคาตลาดเพื่อจัดอันดับ บริษัท และรายได้รวมมีความสัมพันธ์กันอย่างมาก เนื่องจาก บริษัท มีรายได้เพิ่มขึ้นก็มีขนาดใหญ่ขึ้นด้วย นำไปสู่ปัญหาหลายมิติในการวิเคราะห์การถดถอย OLS หากตัวแปรอิสระในแบบจำลองการถดถอยแสดงความสัมพันธ์เชิงเส้นที่คาดเดาได้อย่างสมบูรณ์แบบนั้นเรียกว่าความสัมพันธ์เชิงเส้นตรง

ค่าสัมประสิทธิ์การถดถอยยังคงสม่ำเสมอ แต่ไม่น่าเชื่อถืออีกต่อไปเนื่องจากข้อผิดพลาดมาตรฐานสูงเกินจริง หมายความว่าพลังทำนายของแบบจำลองจะไม่ลดลง แต่ค่าสัมประสิทธิ์อาจไม่มีนัยสำคัญทางสถิติด้วยข้อผิดพลาด Type II ข้อผิดพลาด Type II ในการทดสอบสมมติฐานทางสถิติข้อผิดพลาดประเภท II คือสถานการณ์ที่การทดสอบสมมติฐานล้มเหลวในการปฏิเสธสมมติฐานว่างที่ เป็นเท็จ ในอื่น ๆ

ดังนั้นหากค่าสัมประสิทธิ์ของตัวแปรไม่มีนัยสำคัญทีละตัว - ไม่สามารถปฏิเสธได้ในการทดสอบ t ตามลำดับ - แต่สามารถร่วมกันอธิบายความแปรปรวนของตัวแปรตามด้วยการปฏิเสธในการทดสอบ F และค่าสัมประสิทธิ์การกำหนดสูง (R2) multicollinearity อาจมีอยู่ เป็นหนึ่งในวิธีการตรวจจับความเป็นหลายมิติ

VIF เป็นอีกหนึ่งเครื่องมือที่ใช้กันทั่วไปในการตรวจสอบว่ามีหลายมิติในรูปแบบการถดถอยหรือไม่ วัดว่าค่าความแปรปรวน (หรือข้อผิดพลาดมาตรฐาน) ของค่าสัมประสิทธิ์การถดถอยโดยประมาณนั้นสูงเกินจริงเพียงใดเนื่องจากการเรียงตัวกัน

การใช้ปัจจัยความแปรปรวนของอัตราเงินเฟ้อ

VIF สามารถคำนวณได้จากสูตรด้านล่าง:

ปัจจัยความแปรปรวนของอัตราเงินเฟ้อ - สูตร

โดยที่R i 2แสดงถึงค่าสัมประสิทธิ์การตัดสินใจที่ยังไม่ได้ปรับสำหรับการถอยหลังตัวแปรอิสระบนตัวแปรที่เหลือ กันและกันของ VIF เป็นที่รู้จักกันความอดทน สามารถใช้ VIF หรือค่าเผื่อในการตรวจจับความเป็นหลายมิติได้ขึ้นอยู่กับความชอบส่วนบุคคล

ถ้า R i 2 เท่ากับ 0 จะไม่สามารถทำนายความแปรปรวนของตัวแปรอิสระที่เหลือจากตัวแปรอิสระได้ ดังนั้นเมื่อ VIF หรือความคลาดเคลื่อนเท่ากับ 1 ตัวแปรอิสระจะไม่สัมพันธ์กับตัวแปรที่เหลือซึ่งหมายความว่าไม่มีความสัมพันธ์เชิงเส้นหลายมิติในแบบจำลองการถดถอยนี้ ในกรณีนี้ความแปรปรวนของสัมประสิทธิ์การถดถอยจะไม่สูงเกินจริง

โดยทั่วไป VIF ที่สูงกว่า 4 หรือค่าเผื่อที่ต่ำกว่า 0.25 บ่งชี้ว่าอาจมีหลายมิติหลายมิติและจำเป็นต้องมีการตรวจสอบเพิ่มเติม เมื่อ VIF สูงกว่า 10 หรือค่าความคลาดเคลื่อนต่ำกว่า 0.1 จะมีความสัมพันธ์เชิงเส้นหลายมิติที่จำเป็นต้องได้รับการแก้ไข

อย่างไรก็ตามยังมีสถานการณ์ที่สามารถละเว้น VFI ที่สูงได้อย่างปลอดภัยโดยไม่ต้องทนทุกข์ทรมานจากความสัมพันธ์เชิงเส้น ต่อไปนี้เป็นสามสถานการณ์ดังกล่าว:

1. VIF สูงมีอยู่ในตัวแปรควบคุมเท่านั้น แต่ไม่มีในตัวแปรที่สนใจ ในกรณีนี้ตัวแปรที่สนใจจะไม่เรียงกันเป็นแนวเดียวกันหรือตัวแปรควบคุม ค่าสัมประสิทธิ์การถดถอยจะไม่ได้รับผลกระทบ

2. เมื่อเกิด VIF ที่สูงอันเป็นผลมาจากการรวมผลิตภัณฑ์หรือพลังของตัวแปรอื่น ๆ multicollinearity จะไม่ก่อให้เกิดผลกระทบเชิงลบ ตัวอย่างเช่นแบบจำลองการถดถอยมีทั้ง x และ x2 เป็นตัวแปรอิสระ

3. เมื่อตัวแปรดัมมี่ที่แสดงมากกว่าสองหมวดหมู่มี VIF สูงจะไม่จำเป็นต้องมี multicollinearity ตัวแปรจะมี VIF สูงเสมอหากมีส่วนเล็ก ๆ ของกรณีในหมวดหมู่นี้ไม่ว่าตัวแปรตามหมวดหมู่จะมีความสัมพันธ์กับตัวแปรอื่นหรือไม่

การแก้ไข Multicollinearity

เนื่องจากความแปรปรวนของค่าสัมประสิทธิ์หลายเส้นทำให้ความแปรปรวนของค่าสัมประสิทธิ์เพิ่มขึ้นและทำให้เกิดข้อผิดพลาดประเภท II จึงจำเป็นอย่างยิ่งที่จะต้องตรวจหาและแก้ไข มีสองวิธีที่ง่ายและใช้กันทั่วไปในการแก้ไขความสัมพันธ์หลายมิติตามรายการด้านล่าง:

1. ตัวแรกคือการลบหนึ่ง (หรือมากกว่า) ของตัวแปรที่มีความสัมพันธ์กันสูง เนื่องจากข้อมูลที่ได้รับจากตัวแปรมีความซ้ำซ้อนสัมประสิทธิ์ของการกำหนดจะไม่ลดลงอย่างมากจากการนำออก

2. วิธีที่สองคือการใช้การวิเคราะห์องค์ประกอบหลัก (PCA) หรือการถดถอยกำลังสองน้อยที่สุด (PLS) แทนการถดถอย OLS การถดถอย PLS สามารถลดตัวแปรให้เล็กลงโดยไม่มีความสัมพันธ์กัน ใน PCA จะมีการสร้างตัวแปรที่ไม่เกี่ยวข้องขึ้นมาใหม่ ช่วยลดการสูญเสียข้อมูลและปรับปรุงความสามารถในการคาดเดาของแบบจำลอง

แหล่งข้อมูลเพิ่มเติม

Finance เป็นผู้ให้บริการอย่างเป็นทางการของ Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Certification ระดับโลกการรับรอง Certified Banking & Credit Analyst (CBCA) ™เป็นมาตรฐานระดับโลกสำหรับนักวิเคราะห์สินเชื่อที่ครอบคลุมด้านการเงินการบัญชีการวิเคราะห์เครดิตการวิเคราะห์กระแสเงินสด การสร้างแบบจำลองตามพันธสัญญาการชำระคืนเงินกู้และอื่น ๆ โปรแกรมการรับรองซึ่งออกแบบมาเพื่อช่วยให้ทุกคนเป็นนักวิเคราะห์การเงินระดับโลก เพื่อความก้าวหน้าในอาชีพการงานของคุณแหล่งข้อมูลเพิ่มเติมด้านล่างนี้จะเป็นประโยชน์:

  • แนวคิดสถิติพื้นฐานในการเงินแนวคิดสถิติพื้นฐานสำหรับการเงินความเข้าใจที่มั่นคงเกี่ยวกับสถิติเป็นสิ่งสำคัญอย่างยิ่งในการช่วยให้เราเข้าใจการเงินได้ดีขึ้น นอกจากนี้แนวคิดด้านสถิติยังช่วยให้นักลงทุนตรวจสอบได้
  • วิธีการพยากรณ์วิธีการพยากรณ์วิธีการพยากรณ์ยอดนิยม ในบทความนี้เราจะอธิบายวิธีการพยากรณ์รายได้สี่ประเภทที่นักวิเคราะห์ทางการเงินใช้เพื่อทำนายรายได้ในอนาคต
  • การถดถอยเชิงเส้นพหุคูณการถดถอยเชิงเส้นพหุการถดถอยเชิงเส้นหลายครั้งหมายถึงเทคนิคทางสถิติที่ใช้ในการทำนายผลลัพธ์ของตัวแปรตามตามค่าของตัวแปรอิสระ
  • ตัวแปรสุ่มตัวแปรสุ่มตัวแปรสุ่ม (ตัวแปรสุ่ม) คือตัวแปรประเภทหนึ่งในสถิติซึ่งค่าที่เป็นไปได้จะขึ้นอยู่กับผลลัพธ์ของปรากฏการณ์สุ่มบางอย่าง