ในเดือนมิถุนายน ฉันขอให้ผู้อ่านร่วมมือกันใน “การทดลอง” เกี่ยวกับการค้นพบทางวิทยาศาสตร์ที่เกิดขึ้น การค้นพบนี้เกี่ยวข้องกับสสารมืด ซึ่งเป็นสสารที่มองไม่เห็นและยังไม่ถูกค้นพบ ซึ่งนักวิจัยเชื่อว่ามีสสารมากกว่า 80% ในเอกภพ การทดลองของฉันได้รับแจ้งจากเอกสารที่ส่งไปยังarXiv เมื่อเดือนธันวาคมปีที่แล้ว โดยสมาชิก เอกสารดังกล่าวประกาศการค้นพบเหตุการณ์สองเหตุการณ์
เทียบกับ 0.5
ที่คาดไว้จากพื้นหลัง โดยมีระดับความเชื่อมั่นประมาณ 1.3σ หรือ 21% ไม่มีใครทั้งในหรือนอกการทำงานร่วมกันของ CDMS-II ถือว่านี่เป็น “การค้นพบ” แม้ว่าพวกเขาจะแน่ใจว่า – หรือการทดลองอื่น ๆ – จะพบสสารมืดในที่สุด ฉันจึงถามผู้อ่านสามคำถาม ประการแรก
อะไรจะนับเป็นการค้นพบสสารมืด ประการที่สอง เราควรเรียกสิ่งที่ค้นพบว่า CDMS-II โดยสมมติว่าเป็นเหตุการณ์สสารมืดจริงหรือไม่ ประการที่สาม การค้นพบอื่น ๆ ในวิชาฟิสิกส์ที่ผู้อ่านรู้ซึ่งเติบโตขึ้นเป็นการค้นพบ – หรือไม่ใช่การค้นพบ – ต้องขอบคุณสถิติเพิ่มเติมหรือไม่
คำตอบมากมายทั้งส่งตรงถึงฉันและผ่านคอลัมน์เวอร์ชันออนไลน์ของฉันนั้นร้อนแรงและให้ความกระจ่าง
ผลกระทบของ DAMAPaul Grannis เพื่อนร่วมงานนักฟิสิกส์ของฉันที่ Stony Brook ให้คำตอบที่ชัดเจนตรงไปตรงมาว่า “เมื่อเราเห็น 3σ เราเรียกมันว่าหลักฐาน เมื่อเราเห็น 5σ เราเรียกมันว่าการค้นพบ”
แท้จริงแล้ว 5σ ดูเหมือนจะเป็นหลักการง่ายๆ ในหมู่นักฟิสิกส์เกี่ยวกับระดับความเชื่อมั่นที่จำเป็นสำหรับการค้นพบ สิ่งนี้เกิดขึ้นในช่วงกลางทศวรรษที่ 1990 เมื่อหลักฐานของควาร์กด้านบนสะสมอยู่ในข้อมูลของสองทีมที่ Fermilab ในปี พ.ศ. 2538 ทั้งสองทีมร่วมกันประกาศการค้นพบด้วยระดับความเชื่อมั่น
ที่ 5σ ทำให้ชุมชนการวิจัยเชื่อมั่นในทันทีและกำหนดให้เป็นระดับความเชื่อมั่นมาตรฐานนับตั้งแต่นั้นเป็นต้นมา บทบาทของสถิติและเหตุผลของระดับความเชื่อมั่น 5σ เป็นหัวข้อหลักในฟิสิกส์ของอนุภาค ตัวอย่างเช่น Louis Lyons นักฟิสิกส์แห่งมหาวิทยาลัยอ็อกซ์ฟอร์ดได้จัดการประชุมเชิงปฏิบัติการ
ในหัวข้อนี้
ที่ CERN ในปี 2550 และเขาวางแผนอีกครั้งในหัวข้อเดียวกันที่ CERN ในต้นปีหน้า การดำเนินการในเวิร์กชอปเผยให้เห็นว่าการประยุกต์ใช้สถิติกับฟิสิกส์มีความเข้มข้นและซับซ้อนเพียงใด (ดูหน้าเว็บ )
ในปี 2008 Lyons เขียนบทความ “เปิดประเด็นทางสถิติในฟิสิกส์ของอนุภาค”
ซึ่งรวมหัวข้อ “ทำไม 5σ?” ในขณะที่นักสถิติมักกล่าวว่าการเข้มงวดมากเกินความจำเป็น Lyons เขียนว่า มีเหตุผลดีๆ หลายประการสำหรับเรื่องนี้ หนึ่งคือประสบการณ์ที่ผ่านมา ในขณะที่เขาชี้ให้เห็นว่า “เรามักจะเห็นเอฟเฟกต์ที่น่าสนใจที่ระดับ 3σ หรือ 4σ หายไปเมื่อมีการรวบรวมข้อมูลเพิ่มเติม”
ประการที่สองคือเอฟเฟกต์ “ดูที่อื่น”: การตัดสินใจของคุณในการจัดเรียงข้อมูลลงใน “ถังขยะ” ในฮิสโตแกรมอาจทำหน้าที่ในการรวมความผันผวน ซึ่งหมายความว่า “โอกาสที่ความผันผวน 5 σ จะเกิดขึ้นที่ใดที่หนึ่งในข้อมูลนั้นมีมากกว่านั้นมาก อาจปรากฏขึ้นในตอนแรก” ประการสุดท้าย
นักฟิสิกส์กังวลว่าผลกระทบเชิงระบบบางอย่างอาจได้รับการประเมินต่ำเกินไปหรืออาจพลาดไปโดยสิ้นเชิงอย่างไรก็ตาม โดยพื้นฐานแล้ว 5σ นั้นเป็นไปตามอำเภอใจ โดยมีการค้นพบมากมายที่ยอมรับโดยมีซิกมาน้อยกว่ามาก และบางส่วนก็ไม่ยอมรับแม้จะมีซิกมาสูงกว่าก็ตาม
ตัวอย่างคลาสสิกล่าสุดที่ผู้ตอบแบบสอบถามจำนวนมากเตือนฉัน คือคำกล่าวอ้างที่ยังคงเป็นข้อโต้แย้ง ซึ่งทำขึ้นเมื่อหลายปีก่อนโดยการทดลองของ DAMA/LIBRA ที่ห้องปฏิบัติการแห่งชาติ Gran Sasso ในอิตาลี เพื่อเป็นหลักฐานการมีอยู่ของอนุภาคสสารมืดในรัศมีดาราจักร ที่ระดับความเชื่อมั่น 8.2σ
ไม่มีใครสงสัยว่า
ได้เห็นบางสิ่งบางอย่าง แต่ข้อเท็จจริงที่ว่าการทดลองอื่น ๆ ไม่เห็นอะไรเลย – แม้ว่า DAMA จะทำก็ตาม ทำให้เกิดข้อสงสัยเกี่ยวกับการตีความของ DAMA เช่นเดียวกับการกุศลบางอย่างจากการทำงานร่วมกันเกี่ยวกับการแบ่งปันข้อมูล “ผลกระทบของ DAMA” เน้นย้ำว่าสถิติเพียงอย่างเดียว
ไม่สามารถทำการค้นพบได้ปัจจัยหนึ่งคือการแปลซิกมาเป็นความน่าจะเป็นมักจะเกี่ยวข้องกับสมมติฐานของการแจกแจงแบบปกติของข้อผิดพลาด “มันไม่ชัดเจนว่าจะพิสูจน์ข้อสันนิษฐานนี้อย่างไรในหลาย ๆ กรณี” Charles Jenkins จาก CSIRO ในแคนเบอร์รา ออสเตรเลียบอกฉัน
“และไม่เป็นที่แน่ชัดว่าข้อสันนิษฐานของภาวะปกติมีผลใช้บังคับจนถึงปีกของการกระจาย ถ้าเรามีข้อมูลมากพอที่จะวาดฮิสโตแกรมและตรวจสอบการกระจายข้อผิดพลาดเป็น 5σ เราคงไม่ยุ่งกับสถิติ!” นักวิทยาศาสตร์ยืนยันถึงระดับความสำคัญที่ดูเหมือนจะสุดโต่งนี้ เจนกินส์กล่าวต่อว่า
“นโยบายประกันกับแหล่งที่มาของข้อผิดพลาดจำนวนมากที่ไม่ได้เฉลี่ยออกไปอย่างรวดเร็วและให้หางอ้วนกับการกระจายข้อผิดพลาด” เขากล่าวต่อไปว่าเป็นวิธีที่ประหยัดและสนุกสนานในการจัดการกับปัญหาที่แฝงอยู่ ซึ่งก็คือการกำหนดระดับนัยสำคัญให้กับการสังเกตนั้นจำเป็นต้องมีข้อสันนิษฐาน
เกี่ยวกับการกระจายข้อผิดพลาด “เราต้องมองผลลัพธ์เป็นแพ็คเกจ” เขาเขียน “ซึ่งการตีความทางสถิติเป็นหนึ่งในสิ่งที่อาจผิดพลาด อย่างที่เพื่อนนักเรียนของฉันเคยถามในงานสัมมนาว่า ‘ข้อผิดพลาดของคุณคืออะไร?’”จุดวิกฤตผู้ตอบแบบสอบถามจำนวนน้อยรู้สึกตื่นเต้นกับผลลัพธ์
ของ CDMS-II “ถ้าคุณทอยลูกเต๋า 6 ครั้ง” ราฟาเอล แลง นักฟิสิกส์ดาราศาสตร์จากมหาวิทยาลัยโคลัมเบียในสหรัฐอเมริกากล่าว “คุณจะตื่นเต้นไหมถ้าคุณทอย ‘สี่’ สองครั้ง?”เกือบทุกคนที่ฉันพูดด้วยมีเรื่องเล่า – หลายคนรู้จักกันดี – ของสัญญาณที่หายไป บางส่วนที่ 3σ: การสลายตัวของโปรตอน โมโนโพล เพนทาควาร์ก ส่วนเกินที่ Fermilab ของไอพ่นที่มีโมเมนตัมตามขวางสูง
Credit : sportdogaustralia.com wootadoo.com maewinguesthouse.com dospasos.net kollagenintensivovernight.com gvindor.com chloroville.com veroniquelacoste.com dustinmacdonald.net vergiborcuodeme.net