AI สามารถนำความเที่ยงธรรมมาสู่การสรรหาได้ — หากเราออกแบบมันด้วยความรับผิดชอบ

AI สามารถนำความเที่ยงธรรมมาสู่การสรรหาได้ — หากเราออกแบบมันด้วยความรับผิดชอบ

เว็บไซต์

นอกจากความเป็นผู้นำที่ยอดเยี่ยม แผนธุรกิจที่รัดกุม และผลิตภัณฑ์ที่เป็นที่ต้องการเฉพาะตัวแล้ว หนึ่งในปัจจัยชี้ขาดที่ตัดสินความสำเร็จหรือความล้มเหลวของบริษัทก็คือกลุ่มผู้มีความสามารถ ทีมงานที่มีทักษะและวัฒนธรรมการทำงานเชิงบวกสร้างความแตกต่าง

การออกแบบเว็บไซต์

ด้วยเหตุนี้ การสรรหาผู้มีความสามารถที่ยอดเยี่ยมจึงเป็นหนึ่งในความท้าทายที่บริษัททุกขนาดต้องเผชิญ ไม่ว่าพวกเขาจะเป็นสตาร์ทอัพที่เพิ่งเริ่มต้นหรือบริษัทที่เติบโตเต็มที่ ผู้สมัครที่ผ่านการรับรองมีความต้องการสูงจนบางคนพูดถึงสงครามความสามารถ
นอกจากทักษะที่หนักแน่น (เช่น การศึกษาและประสบการณ์ก่อนหน้านี้) ปัจจัยที่อ่อนนุ่ม ซึ่งมักอยู่ภายใต้ “ความเหมาะสมของวัฒนธรรม” ยังส่งผลต่อความสามารถของผู้สมัครในการแสดงบทบาทใหม่ได้ดี การแข่งขันสำหรับผู้สมัครที่มีคุณสมบัติและความต้องการจ้างคนที่เหมาะสมที่สุดได้เปลี่ยนการสรรหาเป็นงานที่ซับซ้อนและใช้ทรัพยากรมาก
คำมั่นสัญญาของ AI
ในช่วงไม่กี่ปีที่ผ่านมา ปัญญาประดิษฐ์ที่ก้าวกระโดดช่วยลดความซับซ้อนนี้ได้อย่างมาก ผ่าน AI องค์กรสามารถวิเคราะห์ข้อมูลจำนวนมหาศาลได้อย่างรวดเร็ว และใช้ข้อมูลดังกล่าวในการตัดสินใจและคาดการณ์อย่างมีข้อมูล ในใบสมัครรับสมัครงาน ทีม HR สามารถใช้ AI เพื่อประเมินความเหมาะสมและความถนัดของผู้สมัคร
ด้วยประโยชน์ที่เป็นไปได้มหาศาล โซลูชัน AI จึงถูกปรับอย่างรวดเร็ว ในการสำรวจล่าสุดของ Sage เกี่ยวกับ HR อาวุโสและผู้นำด้านบุคคล 500 คนหนึ่งในสามกล่าวว่าพวกเขากำลังเปลี่ยนวิธีการจ้างโดยการสร้างประสบการณ์ผู้สมัครที่ดีขึ้นสำหรับผู้สมัครและพนักงานใหม่ ในขณะที่ 24% ของบริษัทต่างๆ กำลังใช้ AI ในการสรรหาบุคลากร คาดว่าจำนวนดังกล่าวจะเพิ่มขึ้น โดย 56% รายงานว่าพวกเขาวางแผนที่จะนำ AI มาใช้ในปีหน้า การระบาดใหญ่ได้เร่งความเร็วของการเปลี่ยนแปลงสำหรับบริษัทเหล่านี้หลายแห่ง
อคติในกระบวนการจ้างงานแบบดั้งเดิม
เป็นเรื่องปกติที่มนุษย์จะเข้าใจโลกผ่านอคติ ความคิดเห็นที่อุปาทาน และอคติ แต่ในกระบวนการสรรหา สิ่งเหล่านี้เป็นอันตรายต่อทุกฝ่าย การศึกษาแสดงให้เห็นว่าเมื่อการจ้างพนักงานใหม่, ผู้จัดการฝ่ายทรัพยากรบุคคลมีแนวโน้มที่จะแสดงอคติความสัมพันธ์โดยการเลือกผู้สมัครที่เป็นเหมือนพวกเขา แม้แต่แนวคิดเรื่อง “ความเหมาะสมของวัฒนธรรม” ก็อาจนำไปสู่การเลือกปฏิบัติได้ เนื่องจากยังส่งเสริมให้เกิดความสม่ำเสมอในหมู่แรงงานมากกว่าที่จะมีความหลากหลาย มีนัยทางกฎหมายสำหรับการไม่ขจัดอคติออกจากกระบวนการจ้างงาน เนื่องจากเมื่อเร็วๆ นี้ Facebook พบว่าตนเองกำลังประสบปัญหาเพราะเน้นย้ำถึงความเหมาะสมของวัฒนธรรม
อคติโดยไม่รู้ตัว—ความชอบและอคติที่เราไม่รู้ว่าเรามี—มีมาโดยธรรมชาติของมนุษย์ทุกคน พวกเขามักจะมาจากภูมิหลังของเราและไม่จำเป็นต้องชัดเจนในการโต้ตอบแบบวันต่อวันกับผู้อื่น อย่างไรก็ตาม พวกเขาสามารถส่งผลเชิงลบต่อการตัดสินใจของเราเกี่ยวกับคนที่เราอยู่รอบข้างด้วย หากไม่ดำเนินการตามขั้นตอนเพื่อต่อต้านอคติ คณะกรรมการการจ้างงานจำนวนมากอาจเอนเอียงไปหาผู้สมัคร (หรือไม่จ้าง) โดยไม่ตั้งใจตามอคติโดยนัยเหล่านั้น
มีวิธีลดอคติในกระบวนการจ้างงาน เช่น การตรวจทาน CV โดยไม่เปิดเผยตัวตน การถามผู้สมัครแต่ละคนด้วยแคตตาล็อกคำถามเดียวกันในระหว่างการสัมภาษณ์ และสร้างความมั่นใจว่าแผงการจ้างงานจะมีความหลากหลายมากที่สุด อย่างไรก็ตาม การขจัดอคติที่เกิดขึ้นโดยไม่รู้ตัวนั้นทำได้ยากมาก
นี่คือจุดที่ AI เข้ามาเป็นเครื่องมืออันมีค่าในการลดเวลาในการจัดหาแหล่งผู้สมัครที่สนใจที่หลากหลายและติดต่อพวกเขา
AI สามารถขับเคลื่อนความหลากหลาย ความเสมอภาค และการมีส่วนร่วม
ซอฟต์แวร์การสรรหาที่ใช้ AI ไม่เพียงแต่สามารถคัดกรองผู้สมัครหลายร้อยคนในไม่กี่วินาทีเท่านั้น แต่ยังสามารถประเมินจุดข้อมูลที่ปราศจากข้อสันนิษฐาน อคติ และความเหนื่อยล้าทางจิตใจที่มนุษย์มักเกิดขึ้น
แม้ว่าสิ่งสำคัญที่ควรทราบคือ ความเอนเอียงของ AI อาจเป็นปัญหาได้ส่วนใหญ่มาจากการขาดความหลากหลายในการเขียนอัลกอริธึม เครื่องมือที่มีการเข้ารหัสอย่างดีซึ่งช่วยแก้ปัญหานี้ สามารถสร้างโปรไฟล์ผู้สมัครตามคุณสมบัติเพียงอย่างเดียวได้ ตัวอย่างเช่น: ซอฟต์แวร์การสรรหาบุคลากร AI เช่น Fetcher สามารถติดตามและวิเคราะห์ทีมและความต้องการในการจ้างงาน ดังนั้นจึงให้ข้อมูลเชิงลึกเกี่ยวกับจำนวนผู้มีโอกาสเป็นลูกค้าที่ผู้จัดการการว่าจ้างต้องการเพื่อให้แน่ใจว่ามีการจ้างงานสำหรับทุกบทบาท ด้วยการรวม AI เข้ากับ “มนุษย์ในวงกว้าง” Fetcher ยังช่วยให้ทีมที่จ้างงานสามารถฝึกอบรมและตรวจสอบข้อมูล เพื่อให้มั่นใจว่าผู้สมัครที่สนใจจะมีความหลากหลาย
ซอฟต์แวร์ AI สามารถทำงานได้ตลอด 24 ชั่วโมง ทำให้การจัดหาผู้สมัครแบบพาสซีฟใช้เวลาอย่างมีประสิทธิภาพสูงสุด ด้วยการรวบรวมข้อมูลเกี่ยวกับผู้สมัครที่อาจเหมาะสมจากทั่วทั้งเว็บ — รวมถึงเครือข่ายมืออาชีพและโซเชียล — เครื่องมือเหล่านี้มีโปรไฟล์ผู้สมัครที่ครอบคลุมและเป็นปัจจุบันซึ่งง่ายต่อการประเมิน
สามารถประหยัดเวลาได้มากขึ้นด้วยการใช้ซอฟต์แวร์ AI ที่เข้าถึงผู้สมัครที่มีแนวโน้มว่าจะโดยอัตโนมัติทางอีเมล และส่งการติดตามอัตโนมัติและเทมเพลตส่วนบุคคลโดยไม่ต้องสร้างเสียงโดยคอมพิวเตอร์ (ซีรี่ส์ A มูลค่า 6.5 ล้านเหรียญล่าสุดของ Fetcher แสดงให้เห็นถึงศักยภาพมหาศาลที่รอการปลดล็อก)
ในขณะที่การจ้างงานลดลงหลังจากการล็อกดาวน์ของ COVID-19 ขณะนี้กำลังมีเสถียรภาพและสงครามความสามารถได้รับการกำหนดให้กลับมาทำงานอีกครั้ง เครื่องมือ AI สามารถสร้างข้อได้เปรียบที่สำคัญโดยไม่ได้อ้างว่าไม่มีข้อผิดพลาดโดยสมบูรณ์ โดยการจัดหาผู้สมัครที่หลากหลายในตลาดที่มีการแข่งขันสูง ลบอคติที่ไม่ได้สติที่มนุษย์มักมี
การจำแนกประเภทการเรียนรู้ของเครื่องเป็นประเภทของการเรียนรู้ภายใต้การดูแลซึ่งอัลกอริทึมจะจับคู่ชุดของอินพุตกับเอาต์พุตแบบไม่ต่อเนื่อง โมเดลการจำแนกประเภทมีการใช้งานที่หลากหลายในอุตสาหกรรมที่แตกต่างกัน และเป็นหนึ่งในแกนนำหลักของการเรียนรู้ภายใต้การดูแล ความเรียบง่ายของการกำหนดปัญหาทำให้แบบจำลองการจัดหมวดหมู่ค่อนข้างหลากหลายและไม่เชื่อเรื่องพระเจ้าในอุตสาหกรรม
ส่วนสำคัญของแบบจำลองการจัดประเภทอาคารคือการประเมินประสิทธิภาพของแบบจำลอง กล่าวโดยย่อ นักวิทยาศาสตร์ด้านข้อมูลต้องการวิธีที่เชื่อถือได้ในการทดสอบว่าแบบจำลองจะทำนายผลลัพธ์ได้อย่างถูกต้องเพียงใด มีเครื่องมือมากมายสำหรับการประเมินประสิทธิภาพของแบบจำลอง ขึ้นอยู่กับปัญหาที่คุณพยายามแก้ไข บางอย่างอาจมีประโยชน์มากกว่าปัญหาอื่นๆ
ตัวอย่างเช่น หากคุณมีการแสดงผลลัพธ์ทั้งหมดในความถูกต้องของข้อมูลเท่ากัน เมทริกซ์ความสับสนอาจเพียงพอสำหรับการวัดประสิทธิภาพ ในทางกลับกัน หากข้อมูลของคุณแสดงความไม่สมดุล ซึ่งหมายความว่าผลลัพธ์อย่างน้อยหนึ่งรายการได้รับการแสดงอย่างมีนัยสำคัญ คุณอาจต้องการใช้เมตริก เช่น ความแม่นยำ หากคุณต้องการเข้าใจว่าโมเดลของคุณแข็งแกร่งเพียงใดข้ามเกณฑ์การตัดสินใจ เมตริก เช่น พื้นที่ใต้เส้นโค้งลักษณะการทำงานของตัวรับ (AUROC) และพื้นที่ใต้เส้นโค้งการเรียกคืนที่แม่นยำ (AUPRC) อาจเหมาะสมกว่า
เนื่องจากการเลือกเมตริกการจัดหมวดหมู่ที่เหมาะสมขึ้นอยู่กับคำถามที่คุณพยายามตอบ นักวิทยาศาสตร์ข้อมูลทุกคนควรคุ้นเคยกับชุดเมตริกประสิทธิภาพการจัดหมวดหมู่ ไลบรารี Scikit-Learn ใน Python มีโมดูลเมตริกที่ทำให้การคำนวณอย่างรวดเร็วแม่นยำ แม่นยำ AUROC และ AUPRC เป็นเรื่องง่าย นอกจากนี้ การรู้วิธีแสดงภาพประสิทธิภาพของแบบจำลองผ่านกราฟ ROC, กราฟ PR และเมทริกซ์ความสับสนมีความสำคัญเท่าเทียมกัน

เว็บแอพพลิเคชั่น

ในที่นี้ เราจะพิจารณางานในการสร้างแบบจำลองการจัดประเภทอย่างง่ายที่คาดการณ์ความน่าจะเป็นของการเลิกราของลูกค้า Churn หมายถึงเหตุการณ์ที่ลูกค้าออกจากบริษัท ยกเลิกการสมัคร หรือไม่ทำการซื้ออีกต่อไปหลังจากช่วงระยะเวลาหนึ่ง เราจะทำงานร่วมกับข้อมูลTelco Churn ซึ่งมีข้อมูลเกี่ยวกับบริษัทโทรคมนาคมที่สมมติขึ้น งานของเราคือการคาดการณ์ว่าลูกค้าจะออกจากบริษัทหรือไม่ และประเมินว่าแบบจำลองของเราทำงานได้ดีเพียงใด
คู่มือสำหรับผู้เริ่มต้นในการประเมินแบบจำลองการจำแนกประเภทใน PYTHON
การสร้างแบบจำลองการจำแนกประเภท
เมทริกซ์ความแม่นยำและความสับสน
ROC Curve และ AUROC
AUPRC
เราเห็นว่าชุดข้อมูลประกอบด้วย 21 คอลัมน์ที่มีทั้งค่าหมวดหมู่และค่าตัวเลข ข้อมูลยังมี 7,043 แถว ซึ่งสอดคล้องกับลูกค้าที่ไม่ซ้ำ 7,043 ราย
มาสร้างโมเดลง่ายๆ ที่ต้องใช้เวลา ซึ่งก็คือระยะเวลาที่ลูกค้าอยู่กับบริษัท และ MonthlyCharges เป็นอินพุตและคาดการณ์ความน่าจะเป็นที่ลูกค้าจะเลิกใช้ ผลลัพธ์จะเป็นคอลัมน์ Churn ซึ่งมีค่าใช่หรือไม่ใช่
อันดับแรก ให้แก้ไขคอลัมน์เป้าหมายของเราเพื่อให้มีค่าไบนารีที่เครื่องอ่านได้ เราจะให้คอลัมน์ Churn มีค่าหนึ่งสำหรับใช่และศูนย์สำหรับไม่ใช่ เราสามารถทำได้โดยใช้เมธอด where() จาก numpy:
จากนั้นเราสามารถแบ่งข้อมูลของเราสำหรับการฝึกอบรมและการทดสอบ ในการดำเนินการนี้ เราต้องนำเข้าเมธอด train_test_split จากโมดูล model_selection ใน Sklearn มาสร้างชุดการฝึกอบรมที่คิดเป็น 67 เปอร์เซ็นต์ของข้อมูลของเรา แล้วใช้ข้อมูลที่เหลือสำหรับการทดสอบ ชุดทดสอบประกอบด้วยจุดข้อมูล 2,325 จุด
สำหรับแบบจำลองการจัดหมวดหมู่ เราจะใช้แบบจำลองการถดถอยโลจิสติกอย่างง่าย มานำเข้าคลาส LogisticRegression จากโมดูล linear_models ใน Sklearn
เมทริกซ์ความแม่นยำและความสับสน
ตัวชี้วัดประสิทธิภาพที่เรียบง่ายและใช้กันอย่างแพร่หลายคือความแม่นยำ นี่เป็นเพียงจำนวนการคาดคะเนที่ถูกต้องทั้งหมดหารด้วยจำนวนจุดข้อมูลในชุดทดสอบ
เราสามารถนำเข้าวิธี precision_score จากโมดูลเมตริกใน Sklearn และคำนวณความแม่นยำได้ อาร์กิวเมนต์แรกของ precision_score คือป้ายกำกับจริง ซึ่งจัดเก็บไว้ใน y_test อาร์กิวเมนต์ที่สองคือการทำนายซึ่งเก็บไว้ใน y_pred:

Web​ application

เราเห็นว่าแบบจำลองของเรามีความแม่นยำในการทำนายถึง 79 เปอร์เซ็นต์ แม้ว่าสิ่งนี้จะมีประโยชน์ แต่เราไม่รู้จริงๆ ว่าแบบจำลองของเราคาดการณ์อย่างเฉพาะเจาะจงว่าการปั่นป่วนหรือไม่ปั่นป่วน เมทริกซ์ความสับสนสามารถให้ข้อมูลเพิ่มเติมอีกเล็กน้อยว่าแบบจำลองของเราทำงานได้ดีเพียงใดสำหรับแต่ละผลลัพธ์
เมตริกนี้มีความสำคัญที่ต้องพิจารณาหากข้อมูลของคุณไม่สมดุล ตัวอย่างเช่น หากข้อมูลการทดสอบของเรามีป้ายกำกับการหยุดไม่แสดง 95 รายการและป้ายกำกับการหยุดใช้ 5 รายการ การคาดเดาว่า “ไม่หยุด” สำหรับลูกค้าทุกรายอาจทำให้เข้าใจผิดได้ว่ามีความถูกต้อง 95 เปอร์เซ็นต์
เราจะสร้างความสับสน_เมทริกซ์จากการคาดคะเนของเราตอนนี้ มานำเข้าแพ็คเกจเมทริกซ์ความสับสนจากโมดูลเมตริกใน Sklearn:
ดังนั้น ตัวเลขนี้บอกอะไรเราเกี่ยวกับประสิทธิภาพของแบบจำลองของเราอย่างแน่นอน เมื่อมองไปตามเส้นทแยงมุมของเมทริกซ์ความสับสน เรามาสนใจตัวเลข 1,553 และ 289 กัน ตัวเลข 1,553 ตรงกับจำนวนลูกค้าที่แบบจำลองทำนายไว้อย่างถูกต้องว่าจะไม่เลิกรา ซึ่งหมายความว่าพวกเขาจะอยู่กับบริษัทต่อไป ตัวเลข 289 สอดคล้องกับจำนวนลูกค้าที่โมเดลคาดการณ์ว่าจะเลิกใช้อย่างถูกต้อง
มันจะดีกว่าถ้าเราสามารถแสดงสิ่งเหล่านี้เป็นเปอร์เซ็นต์ของจำนวนทั้งหมด ตัวอย่างเช่น จะเป็นประโยชน์ที่จะทราบว่าลูกค้าที่คาดการณ์ไว้อย่างถูกต้อง 289 รายคิดเป็นเปอร์เซ็นต์ของการเปลี่ยนแปลงทั้งหมดกี่เปอร์เซ็นต์ เราสามารถแสดงเปอร์เซ็นต์สำหรับแต่ละผลลัพธ์โดยเพิ่มบรรทัดโค้ดต่อไปนี้ก่อนพล็อตแผนที่ความหนาแน่นของเรา:
ดังที่เราเห็น แบบจำลองของเราทำนายได้อย่างถูกต้อง 91 เปอร์เซ็นต์ของลูกค้าที่ไม่เลิกรา และ 46 เปอร์เซ็นต์ของลูกค้าที่ทำเช่นนั้น สิ่งนี้แสดงให้เห็นอย่างชัดเจนถึงข้อจำกัดของการใช้ความแม่นยำ เนื่องจากไม่ได้ให้ข้อมูลเกี่ยวกับเปอร์เซ็นต์ของผลลัพธ์ที่คาดการณ์ไว้อย่างถูกต้อง
ROC Curve และ AUROC
บ่อยครั้ง บริษัทต้องการทำงานกับความน่าจะเป็นที่คาดการณ์ไว้ แทนที่จะใช้ป้ายกำกับแยกกัน ซึ่งช่วยให้พวกเขาเลือกเกณฑ์สำหรับการติดป้ายกำกับผลลัพธ์เป็นค่าลบหรือค่าบวก เมื่อต้องรับมือกับความน่าจะเป็น เราต้องการวิธีการวัดว่าตัวแบบมีการสรุปข้อมูลทั่วเกณฑ์ความน่าจะเป็นได้ดีเพียงใด จนถึงตอนนี้ อัลกอริทึมของเราได้รับการกำหนดป้ายกำกับไบนารีโดยใช้เกณฑ์เริ่มต้นที่ 0.5 แต่เกณฑ์ความน่าจะเป็นในอุดมคติอาจสูงหรือต่ำกว่านั้น ขึ้นอยู่กับกรณีการใช้งาน
ในกรณีของข้อมูลที่สมดุล เกณฑ์ในอุดมคติคือ 0.5 เมื่อข้อมูลของเราไม่สมดุล เกณฑ์ในอุดมคติมักจะต่ำกว่า นอกจากนี้ บางครั้งบริษัทต้องการทำงานกับความน่าจะเป็น แทนที่จะใช้ป้ายกำกับแยกกันโดยสิ้นเชิง เมื่อพิจารณาถึงความสำคัญของความน่าจะเป็นในการคาดคะเน การทำความเข้าใจว่าเมตริกใดที่จะใช้ในการประเมินจึงเป็นประโยชน์
AUROC เป็นวิธีวัดว่าโมเดลของคุณแข็งแกร่งเพียงใดผ่านเกณฑ์การตัดสินใจ เป็นพื้นที่ใต้แผนภาพของอัตราบวกจริงกับอัตราบวกลวง อัตราบวกจริง (TPR) คือ (ผลบวกจริง)/(ผลบวกจริง + ผลลบเท็จ) อัตราผลบวกลวงคือ (ผลบวกลวง)/(ผลบวกลวง + ค่าลบจริง)
ในบริบทของปัญหาการเลิกใช้ของเรา สิ่งนี้จะวัดว่าแบบจำลองของเราดึงดูดลูกค้าที่ไม่เลิกใช้ตามเกณฑ์ความน่าจะเป็นที่ต่างกันได้ดีเพียงใด
เริ่มต้นด้วยการคำนวณ AUROC มานำเข้าเมธอด roc_curve และ roc_auc_score จากโมดูลเมตริก:

Robot Auto process

ยิ่งอัตราบวกที่แท้จริงเข้าใกล้อัตราหนึ่งเร็วเท่าใด พฤติกรรมของเส้นโค้ง ROC ของเราก็จะยิ่งดีขึ้นเท่านั้น ดังนั้น โมเดลของเราจึงทำงานได้ดีในแง่เหล่านี้
นอกจากนี้ AUROC ที่ 0.82 นั้นค่อนข้างดีเนื่องจากโมเดลที่สมบูรณ์แบบจะมี AUROC ที่ 1.0 เราเห็นว่า 91 เปอร์เซ็นต์ของกรณีเชิงลบ (หมายถึงไม่มีการเลิกรา) ได้รับการคาดการณ์อย่างถูกต้องโดยแบบจำลองของเราเมื่อใช้เกณฑ์เริ่มต้นที่ 0.5 ดังนั้นสิ่งนี้จึงไม่น่าแปลกใจมากนัก