ประสบการณ์การฟังที่ดีที่สุดอยู่บน Chrome, Firefox หรือ Safari สมัครรับเสียงสัมภาษณ์ประจำวันของ Federal Drive ใน Apple Podcasts หรือ PodcastOneการระบาดใหญ่ของ COVID-19 ทำให้พืชผลเกือบทุกอย่างที่สัมผัสรวมถึงการวิจัย ฐานข้อมูลที่เชื่อถือได้แห่งหนึ่งรายงานว่า 4% ของงานวิจัยทางวิทยาศาสตร์ทั้งหมดที่เผยแพร่เมื่อปีที่แล้วเกี่ยวข้องกับโควิด และคุณเดาได้ว่ามันสร้างข้อมูล ข้อมูลจำนวนมากและจำนวนมาก ขณะนี้ ห้องปฏิบัติการแห่งชาติแปซิฟิกตะวันตกเฉียงเหนือกำลังพยายามค้นหาความ หมายในทะเลข้อมูลที่มืดมน
นักวิทยาศาสตร์ข้อมูล Neeraj Kumar เข้าร่วม กับ Federal Drive
กับ Tom Teminด้วยข้อมูลเพิ่มเติมเกี่ยวกับโครงการนี้ค้นหาว่าเหตุใดการจัดการสายธารคุณค่าจึงได้รับความนิยมในฐานะกรอบงานสำหรับการวัดมูลค่าในสภาพแวดล้อม DevSecOps
Neeraj Kumar:ขอบคุณสำหรับคำเชิญTom Temin: อย่างแรกเลย โปรเจกต์นี้ลงเอยที่ Pacific Northwest National Laboratory ในทุกแห่งได้อย่างไร
นีราชกุมาร:ใช่คำถามที่ดี อย่างที่คุณทราบ เมื่อการระบาดเริ่มต้นขึ้น เราทุกคนเริ่มเรียนรู้เกี่ยวกับสิ่งที่เราสามารถทำได้ผ่านวิทยาศาสตร์ข้อมูล ผ่านความรู้ที่เรารู้อยู่แล้วเกี่ยวกับ SARS-CoV-2 หรือไวรัสโคโรนาที่เกี่ยวข้อง และหนึ่งในสิ่งที่เราทำที่ Pacific Northwest National Laboratory ร่วมกับห้องปฏิบัติการระดับชาติอื่น ๆ ที่เรามีฐานผู้ใช้ [Energy Department] ซึ่งสามารถใช้เพื่อให้เกิดความเข้าใจพื้นฐานของสิ่งต่าง ๆ ที่อาจไม่มีในภาคเอกชน . วิธีการทำงานคือเราพยายามหาความรู้จากข้อมูลที่มีอยู่ เราจะใช้เครื่องมือสร้างแบบจำลองคอมพิวเตอร์ปัญญาประดิษฐ์เพื่อทำความเข้าใจประเภทของโครงสร้างโปรตีนที่เกี่ยวข้องกับจีโนมของ SARS-Cov-2 ได้อย่างไร อย่างที่คุณทราบ SARS-Cov-2 ประกอบด้วยโปรตีน 27 ชนิดที่แตกต่างกัน เข้าใจการทำงานของโปรตีนเหล่านั้น วิธีจับตัวยับยั้ง วิธีการพัฒนาความเข้าใจพื้นฐานของผู้สมัครต้านไวรัส ซึ่งสามารถทำหน้าที่เป็นตัวยับยั้งโปรตีนเหล่านั้น – เป็นขั้นตอนแรกสำหรับความคืบหน้าในทิศทางนั้น นั่นคือวิธีที่เราสามารถนำวิทยาศาสตร์ข้อมูลพร้อมกับโครงการตรวจสอบเชิงทดลองมาสู่ PNNL
Tom Temin: แล้วคุณได้ข้อมูลมาอย่างไร?
คุณเพิ่งได้รับจากโอเพ่นซอร์สแล้วนำเข้าสู่ห้องปฏิบัติการหรือไม่?
Neeraj Kumar:ใช่ เรารวบรวมข้อมูลจากแพลตฟอร์มสาธารณะ พร้อมกับ – เราสร้างข้อมูลสังเคราะห์โดยใช้เครื่องมือการเรียนรู้ของเครื่องปัญญาประดิษฐ์ของเรา เรียกว่าการสร้าง … หรือโครงสร้าง 3 มิติที่คล้ายคลึงกันของ [a] ผู้เข้ารับการรักษาที่สามารถคัดกรองเทียบกับโปรตีนเป้าหมายที่กำหนดซึ่งเป็นที่สนใจ เพื่อตอบคำถามของคุณ เราได้รวบรวมข้อมูลจากแพลตฟอร์มสาธารณะ แต่เราสร้างขึ้นที่นี่ที่ Pacific Northwest National Laboratory ด้วย
Tom Temin: และคุณเก็บไว้ในเครื่องหรือไม่? คุณเก็บไว้ในซูเปอร์คอมพิวเตอร์ของคุณหรือไม่? หรือข้อมูลทั้งหมดนี้อยู่ในระบบคลาวด์เชิงพาณิชย์
Neeraj Kumar:เรามีคอมพิวเตอร์ประสิทธิภาพสูงที่ห้องปฏิบัติการ ดังนั้นเราจึงเก็บข้อมูลทั้งหมดไว้ใน [a] ซูเปอร์คอมพิวเตอร์ และในขณะเดียวกัน เราก็มีสิ่งอำนวยความสะดวกสำหรับผู้ใช้พื้นฐาน DOE ซึ่งเปรียบเสมือนได้รับทุนโดยตรงจากการประมวลผลประสิทธิภาพสูงจาก DOE และเราใช้ทรัพยากรการประมวลผลจำนวนมหาศาล ไม่เพียงแต่เพื่อเก็บข้อมูลเท่านั้น แต่เพื่อรันโมเดลของเรา ทำฟิสิกส์ เราใช้การสร้างโมเดลเพื่อทำความเข้าใจข้อมูลนั้น
Tom Temin: และคุณกำลังพยายามเรียนรู้เพิ่มเติมเกี่ยวกับโปรตีนและความหมายของทั้งหมดนี้ และเพื่อให้ได้คำตอบเกี่ยวกับวิธีการสร้างทั้งหมด คุณเป็นนักวิทยาศาสตร์ข้อมูล คุณจะรู้ได้อย่างไรว่าคำถามใดที่จะใช้กับข้อมูลนี้ เพราะดูเหมือนว่าจะต้องมาจากแพทย์