SCBX Unlocking AI: EP.4 How AI See Things Like We Do

: SCBX Unlocking AI: EP.4 How AI See Things Like We Do

SCBX Unlocking AI: EP.4 How AI See Things Like We Do

เมื่อเทคโนโลยีพัฒนามากขึ้นเรื่อยๆ ประสิทธิภาพของคอมพิวเตอร์และสิ่งที่เรียกว่า Computer Vision ก็กว้างไกลขึ้น ช่วยให้ทุกคนสามารถสำรวจโลกที่มีขนาดกว้างใหญ่ได้ง่ายขึ้น และหากมันอยู่ในมือคนที่มีความคิดสร้างสรรค์ ก็จะช่วยพัฒนาสิ่งดีๆ ให้เกิดขึ้นตามมาอีกมากมาย

สรุปเนื้อหาจากงาน SCBX UNLOCKING AI: EP4

  • Venue: SCBX NEXT STAGE | 4th Floor, Siam Paragon
  • Collaboration: SCBX และ  Insiderly.ai
  • Speakers:
    • ดร.สรรพฤทธิ์ มฤคทัต – Senior Researcher, NECTEC
    • ดร. กอบกฤตย์ วิริยะยุทธกร – President, AIEAT และ CEO บริษัท iApp Technology
    • นพ.ปิยะฤทธิ์ อิทธิชัยวงศ์ – CEO & Co-Founder, PreceptorAI
    • คุณศิวดล มาตยากูร – Co-Founder, Cariva

Exploring the world of Computer Vision

ดร.สรรพฤทธิ์ มฤคทัต Senior Researcher, NECTEC

ในงานเสวนา SCBX UNLOCKING AI: EP4 หัวข้อ Computer Vision: How AI See Things Like We Do ดร.สรรพฤทธิ์ มฤคทัต Senior Researcher, NECTEC ได้มาบรรยายในหัวข้อ Exploring the World of Computer Vision เพื่ออธิบายว่าเทคโนโลยี AI สุดล้ำนี้จะช่วยให้ชีวิตของผู้คนดีขึ้นได้อย่างไร โดยแบ่งเป็นประเด็นสำคัญได้ดังต่อไปนี้

Computer Vision: How AI See Things Like We Do ดร.สรรพฤทธิ์ มฤคทัต

ถ้าอยากรู้ว่า Computer Vision สามารถนำมาใช้ประโยชน์ด้านไหนได้บ้าง วิธีที่ง่ายที่สุดคือการดูภาพยนตร์ฮอลลีวู้ด เช่น ภาพยนตร์ตระกูล ‘ฅนเหล็ก’ The Terminator ที่เจ้าหุ่นยนต์อัจฉริยะนั้นมาพร้อมความไฮเทครอบด้าน หนึ่งในนั้นก็คือการมองเห็นสิ่งต่างๆ แล้วตรวจจับสิ่งของต่างๆ ประมวลผลออกมาเป็นภาพ หรือในภาพยนตร์เรื่อง Eagle Eyes ที่ปัญญาประดิษฐ์พยายามอ่านปากคนเพื่อดูว่าพูดอะไร ก็เป็นอีกความไฮเทคที่น่าสนใจเช่นกัน

สิ่งที่พบเจอในภาพยนตร์เหล่านี้ เมื่อก่อนอาจมองกันว่าไม่มีทางเป็นความเป็นจริงได้ แต่ตอนนี้เกิดขึ้นจริง หรือมีแนวโน้มใกล้กลายเป็นจริงแล้ว และไม่เพียงแค่ในภาพยนตร์ 2 เรื่องนี้เท่านั้นที่วาดภาพของการใช้เทคโนโลยีสุดล้ำทะลุกรอบความคิด แต่ยังมีเทคโนโลยีในหนังอีกมากมายที่กลายมาเป็นความจริงแล้ว เพียงแต่อาจยังไม่ได้ก้าวล้ำชนิดนำมาใช้ได้จริงอย่างแพร่หลายตามแบบเรื่องเล่า

Computer Vision from movie

หนึ่งในสิ่งที่ Computer Vision ช่วยให้ชีวิตของเราง่ายขึ้นได้เลยทันทีก็คือ การช่วยค้นหาข้อมูลรูปแบบต่าง ๆ เช่น การค้นหารูป จากแต่ก่อนที่ต้องนั่งค้นหารูปไม่ติดลิขสิทธิ์จากแพลตฟอร์มต่างๆ แต่ทุกวันนี้เราสามารถสร้างสรรค์ภาพใหม่ขึ้นมาได้เลย เพียงใช้ Generative AI หลายประเภท และมีหลายแพลตฟอร์มที่รองรับภาพไม่ผิดลิขสิทธิ์แล้ว

งาน Computer Vision ที่ล้ำลึกขึ้น ถูกนำมาใช้งานได้ในหลายสาขาอาชีพ เช่น วงการแพทย์ที่ใช้ AI ช่วยปรับคุณภาพของรูปภาพให้ดีขึ้น เพื่อช่วยแพทย์วินิจฉัยภาพเอกซเรย์ได้แม่นยำขึ้น ไปจนถึงการใช้ AI ตรวจจับวัตถุ เช่น ตรวจจับก้อนเนื้อในช่องท้อง การทำโมเดล 3D Recognition และการทำ Speech Recognition เป็นต้น

ดร.สรรพฤทธิ์ อธิบายหลักการมองโลกของคอมพิวเตอร์ว่า คอมพิวเตอร์จะมองโลกเป็นพิกเซล (Pixel) มองเป็นรูปสี่เหลี่ยมเล็กๆ ที่วางต่อกันจนเกิดเป็นภาพขนาดใหญ่ แตกต่างจากสายตาของคนเราที่จะมองเห็นภาพใหญ่ก่อน

งานยุคแรกที่นำ Computer Vision มาใช้ประโยชน์ก็คืองานออกแบบ โดยเขียน Code เพื่อประกอบของสิ่งเล็กๆ ระดับพิกเซลขึ้นมา ค่อยๆ ศึกษาลักษณะเด่น (Feature) ของสิ่งต่างๆ แล้วประกอบกันกลายเป็นภาพใหญ่ งาน Computer Vision เริ่มต้นขึ้นในยุคที่ไม่มีคำว่า AI เลยด้วยซ้ำ

ปัจจุบันมีการนำโครงข่ายประสาทเทียมมาใช้ในงาน Computer Vision เพื่อช่วยสกัดลักษณะเด่นโดยอัตโนมัติจากพิกเซลต่างๆ ที่ประกอบกันเป็นรูป

  • ในหลาย ๆ งานทีมวิจัยหลายทีมพบว่าลักษณะเด่นที่ได้จากโครงข่ายประสาทเทียมเหล่านี้ให้ผลดีกว่าลักษณะเด่นที่ออกแบบโดยผู้เชี่ยวชาญ เพราะมีความเหมือนและใกล้เคียงกันไม่น้อย
  • เนื่องจากการประกอบกันของพิกเซลแต่ละพิกเซลนั้น เหมือนกับเส้นประสาทที่มารวมกันจนกลายเป็นระบบประสาท
  • เป็นแรงบันดาลใจให้นักวิจัย นักสร้างสรรค์เกิดไอเดียว่าถ้าอยากสร้าง Network ใหญ่ๆ ขึ้นมาควรต้องทำอย่างไร นำไปสู่การสร้างระบบบันทึกใบหน้า ที่จะบันทึกลักษณะเด่นของใบหน้าเรา นำไปใช้ตรวจจับวัตถุที่เคลื่อนที่ว่าอยู่ตรงไหนนั่นเอง
  • งานวิจัยด้านโครงข่ายประสาทเทียมนั้นมีมานานแล้ว ก่อนจะมี AI เสียอีก
  • แต่ในอดีตเราไม่มีวิธีสร้างโครงข่ายขนาดใหญ่ที่ใช้งานได้ดี
  • ปัจจุบันเรารู้แล้วว่าหากต้องการสร้างโครงข่ายขนาดใหญ่ ต้องทำอย่างไร อีกทั้งปริมาณข้อมูล และความสามารถในการคำนวณก็ดีขึ้นกว่าสมัยก่อนมาก
  • ทำให้การสร้างและการใช้งานโครงข่ายขนาดใหญ่ หรือที่เรียกว่า Deep Neural Network นั้นทำกันอย่างแพร่หลาย
  • ระบบที่เราใช้งานกันทั่วไป เช่น ระบบการตรวจสอบตัวบุคคลจากภาพใบหน้า
  • หรือระบบการตรวจจับวัตถุต่าง ๆ เช่น รถยนต์ จักรยานยนต์ หรือคน ต่างก็ใช้ Deep Neural Network
  • เรียกได้ว่างานด้าน Computer Vision ในปัจจุบันนั้นใช้ Deep Neural Network กันหมดเลย

Computer vision Deep Neural Network

ในด้านการแพทย์ เช่น การวิเคราะห์ภาพเอกซเรย์ปอด ก็ใช้หลักการเดียวกัน ระบบนั่นคือ โครงข่ายประสาทเทียมที่ใช้จะสร้างลักษณะเด่นที่เหมาะสมในการวินิจฉัยภาพ เช่น เป็นภาพเอกซเรย์ปอดของคนปกติ หรือของผู้ป่วยโควิด-19 หรือการวิเคราะห์โรคธาลัสซีเมียจากภาพถ่ายสไลด์เลือดก็ใช้ Deep Neural Network เช่นกัน

ลักษณะเด่นที่สร้างจากโครงข่ายประสาทเทียมเหล่านี้อาจไม่ไม่สามารถนำไปตีความเป็นคำพูดได้ตรง ๆ ทำให้แพทย์ทั่วไปไม่ยอมรับการวินิจฉัยโดยโครงข่ายประสาทเทียมเหล่านี้

ในปัจจุบันมีแพทย์ที่หันมาทำวิจัยเรื่อง AI เองเยอะมาก และในงานประชุมวิจัยทางการแพทย์ก็มีการประชุมวิจัยหัวข้อนี้เยอะกว่าเดิมอย่างมีนัยสำคัญ เมื่อเทียบกับ 5-6 ปีก่อน ถือเป็นกลไกสำคัญที่ทำให้เกิดการยอมรับการวินิจฉัยโดยโครงข่ายประสาทเทียมมากขึ้นเรื่อย ๆ

Neural Network timeline

ในปัจจุบันยังมีการสร้าง AI ที่สามารถทำงานบนทั้งภาพและข้อความ เช่น Stable Diffusion ที่สร้างภาพจากคำบรรยาย ระบบพวก Image Captioning ที่สร้างคำบรรยายสำหรับภาพ ระบบ Visual Question Answering ที่สามารถตอบคำถามที่เกี่ยวข้องกับภาพได้ หรือระบบ CLIP ของ OpenAI ที่ช่วยดูความสอดคล้องระหว่างภาพและคำบรรยาย เป็นต้น

Visual Question Answering (VQA)

Contrastive Language-Image Pretrained (CLIP)

แต่ถึงจะนำมาใช้งานในปัจจุบันได้มากมาย ความท้าทายของงาน Computer Vision ก็มีไม่น้อย เช่น เมื่อข้อมูลเยอะขึ้น หากต้องการต้องสร้างรูปจำนวนมาก แล้วสร้างคำบรรยายภาพที่สอดคล้องกันในเวลารวดเร็ว จะควบคุมคุณภาพได้อย่างไร

อีกความท้าทายที่นักพัฒนาต้องเจอก็คือ การเข้าถึงข้อมูล Data ด้วยข้อมูลที่จำกัดทำให้นักวิจัย-คนทำงานไม่สามารถพัฒนางานที่มีคุณภาพขึ้นมาได้ เพราะบ่อยครั้งผู้ที่มีข้อมูลไม่อนุญาตให้นำไปใช้งาน หรือพัฒนาต่อ ส่งผลให้การทำงานไม่ได้คุณภาพออกมาตามที่ต้องการ

นอกจากนั้น AI ที่เก่งกาจด้านภาษาไทยก็ยังมีน้อย เมื่อเทียบกับโมเดลจากต่างประเทศที่พัฒนาแล้ว ซึ่งก็จะนำมาสู่ความท้าทายข้อเบื้องต้นที่ได้กล่าวมาแล้วนั่นเอง และอื่นๆ อีกมากมาย

Generative AI for Thai Document OCR

ดร. กอบกฤตย์ วิริยะยุทธกร – President, AIEAT และ CEO บริษัท iApp Technology

น้อยคนนักจะชอบทำงานเอกสาร เพราะเป็นงานที่ยุ่งยาก ซับซ้อน และไม่ได้เสริมสร้างทักษะใหม่ๆ ให้เกิดขึ้นกับตัวเอง แต่หลายคนน่าจะถูกใจเมื่อรู้ว่าการใช้ Generative AI นั้นทำให้งานเอกสารที่เคยน่าเบื่อ สามารถเสร็จสิ้นได้ในเวลารวดเร็ว เพื่อไปทำงานอื่นที่มีประโยชน์กว่าแทน

เทคโนโลยีช่วยทำงานเอกสารนี้มีชื่อว่า OCR หมายถึง Optical Character Recognition ซึ่งเป็นกระบวนการเปลี่ยนข้อมูล ไม่ว่าจะเป็นรูปภาพ หรือข้อความ ในรูปแบบ Analog ให้กลายมาเป็นข้อมูลดิจิทัลที่จัดเรียงกันอย่างเป็นระเบียบนั่นเอง

Generative AI for Thai Document OCR

ดร.กอบกฤตย์ อธิบายว่าในเมืองไทย เราสามารถใช้ AI ช่วยแกะข้อมูลเอกสารได้นานแล้วตั้งแต่ปี 2018 โดยเฉพาะอย่างยิ่งการแกะข้อมูลในบัตรประชาชน ผ่านการทำ Object Detection หรือการตัดข้อมูลขนาดใหญ่ให้เป็นชิ้นเล็กๆ จากนั้นจึงจัดวางตำแหน่งข้อมูลให้เรียงกันอย่างมีรูปแบบ เพื่อจะได้รู้ว่าส่วนไหนเป็นส่วนไหน

Thai National ID Card OCR

Thai National ID Card OCR

แต่ในอนาคต เราจะไม่ต้องใช้ Object Detection แล้ว เพราะเราสามารถใช้ความฉลาดอย่าง GPT สามารถสกัดข้อความที่เป็น OCR ทั้งภาพแบบดิบๆ และจัดเรียงออกมาเป็นข้อมูลที่มีโครงสร้างได้อัตโนมัติ

ข้อได้เปรียบเพิ่มเติมของการไม่ต้องใช้ Object Detection คือเราจะสามารถสนับสนุนเอกสารที่ไม่มี Template ตายตัวได้ อาทิเช่น ใบเสร็จรับเงินที่มีรูปแบบหลากหลาย ทำให้ Thai Document OCR มีความ Flexible และสามารถรับเอกสารใหม่ๆได้ทันที

ข้อดีของการทำ OCR ก็คือ ช่วยคนทำงานจัดการกับข้อมูลในเอกสารต่างๆ เช่น จดหมายราชการ ใบเสนอราคา ใบเสร็จรับเงิน ใบแจ้งหนี้ ที่สามารถนำมาจัดเรียงเป็นโครงสร้างที่จัดเรียงสวยงามได้อย่างเป็นระเบียบในเวลาที่รวดเร็ว ไม่ต้องเสียเวลาคีย์ข้อมูลทีละอย่างและทีละใบจนจบ

Thai Document OCR Input and Output

Dynamic Template Technique for Thai Document OCR

Dynamic Template Technique for Thai Document OCR

แต่ทั้งนี้ก็มีข้อเสียคือ ระบบ GPT4 ในปัจจุบันนั้นยังประมวลผลข้อมูลช้ามาก โดยเฉพาะอย่างยิ่งหากป้อนข้อมูลเป็นภาษาไทย โดยเฉลี่ยแล้วจะกินเวลาในการประมวลนาน 60-90 วินาที ซึ่งดูเผินๆ อาจเหมือนไม่นาน แต่หากต้องจัดการเอกสารมากกว่า 100 แผ่น นั่นหมายถึงต้นทุนที่เพิ่มมากขึ้นตามไปด้วย

ข่าวดีก็คือ ในประเทศไทยกำลังพัฒนา Generative AI ของไทยเองชื่อว่า OpenThaiGPT ซึ่งเป็น AI ที่รวบรวมองค์ความรู้ภาษาไทย และมีฐานข้อมูลแหล่งสำคัญมาจากเว็บไซต์ Pantip ปัจจุบันแม้กำลังอยู่ในช่วงทดลองใช้งาน แต่ก็สามารถทำ OCR ช่วยจัดการงานเอกสารตามขั้นตอนดังกล่าวได้ในเวลาเพียงแค่ 5 วินาที ได้รับการคาดหมายว่าจะช่วยให้คนไทยทำงานกับเอกสารขนาดเยอะได้รวดเร็วขึ้น

OpenThaiGPT

OpenThaiGPT

OpenThaiGPT

Making OpenThaiGPT

ดร.กอบกฤตย์ ยังแย้มอีกว่า OpenThaiGPT กำลังฉลาดๆ ขึ้นเรื่อยๆ ล่าสุดทีมพัฒนาลองเอาข้อสอบ ONET ระดับชั้นมัธยมศึกษาปีที่ 6 ให้ทำแล้วได้ผลคะแนนมากกว่าค่าเฉลี่ยที่เด็กไทยสามารถทำได้อีกด้วย ไม่เพียงแค่นั้น OpenThaiGpt ยังเก่งภาษาอังกฤษด้วย ไม่แค่ถนัดภาษาไทยอย่างเดียว

Intelligence of OpenThaiGPT

ทั้งนี้ทั้งนั้น ดร.กอบกฤตย์ ยอมรับว่าในภาพรวม Open AI ของบ้านเราอาจยังฉลาดสู้ AI เมืองนอกไม่ได้ แต่ก็ถือเป็นนิมิตหมายอันดีว่า นี่จะเป็นก้าวย่างสำคัญ ช่วยให้การทำงานของคนไทยดีขึ้นกว่าเดิม และภายในสิ้นปีนี้จะมีการปล่อย OpenThaiGPT เวอร์ชัน 70b ออกมาด้วย ซึ่งจะฉลาดกว่าเดิมอีกหลายเท่า หวังว่าจะช่วยให้เกิดการทำงานที่แหลมคมมากขึ้นตามมา

OpenThaiGPT version 70b

Generative AI in Medical Imaging Just for Fun or the Game Changer?

นพ.ปิยะฤทธิ์ อิทธิชัยวงศ์ – CEO & Co-Founder, PreceptorAI

ทุกวันนี้เราสามารถนำ Generative AI มาช่วยมนุษย์ทำงานได้หลากหลาย ไม่ว่าจะงานเอกสาร งานบัญชี งานแปลภาษา ไปจนถึงงานสร้างสรรค์ สร้างรูปภาพ ไม่เพียงแค่นั้น AI ในปัจจุบันยังมีประโยชน์ทางการแพทย์ด้วย โดยมีแพทย์หลายคนมุ่งมั่นกับการนำมาใช้รักษาคนไข้ให้มีประสิทธิภาพ ยกระดับแวดวงสุขภาพของประเทศ

หนึ่งในนั้นก็คือ นพ.ปิยะฤทธิ์ อิทธิชัยวงศ์ แพทย์จากโรงพยาบาลศิริราช ผู้ยังเป็น CEO และ Co-Founder ของบริษัทเทคโนโลยี PreceptorAI โดยในงานเสวนา SCBX UNLOCKING AI: EP4 Computer Vision: How AI See Things Like We Do ได้มาบรรยายหัวข้อ Generative AI in Medical Imaging Just for Fun or the Game Changer? เพื่อวิเคราะห์ว่า นอกจาก AI จะสร้างภาพสนุกๆ ได้แล้ว มันมีประโยชน์และช่วยเปลี่ยนโลกจริงๆ ไม่ใช่แค่ของเล่นให้คนรู้สึกสนุกชั่วคราว

Generative AI in Medical Imaging Just for Fun or the Game Changer?

นพ.ปิยะฤทธิ์ ย้อนความว่า ที่ผ่านมาเวลาแพทย์จะวินิจฉัยโรคเฉพาะด้าน เช่น วิเคราะห์เม็ดเลือด จะต้องเอาแพทย์ที่เทรนด้านนี้โดยเฉพาะ แต่ด้วยจำนวนแพทย์ที่เทรนมานั้นไม่เยอะมาก หากมีผู้ป่วยต้องเข้ารับการรักษาอย่างทันท่วงทีจะดูแลไม่ทันการณ์ จึงพยายามค้นหาว่ามีวิธีไหนบ้างที่ช่วยคนไข้ได้เร็วกว่านั้น นำมาสู่นวัตกรรมดูแลคนไข้ยุคใหม่ที่ไม่เพียงช่วยวิเคราะห์เม็ดเลือดได้ แต่ยังวิเคราะห์พยาธิ และอื่นๆ อีกมากมายได้อีกด้วย

นพ.ปิยะฤทธิ์ เล่าว่ามี Generative AI ที่ดังมากโปรแกรมหนึ่งเกิดขึ้นในปี 2014 โดย Google คิดค้นภาพที่พัฒนาขึ้นใหม่ในระบบ GAN หรือ Generative Adversarial Network ซึ่งทำงานภายใต้หลักการสร้างภาพแบบ โจร vs ตำรวจ

Generative Adversarial Network

Generative Adversarial Network

กล่าวคือ เป็นเทคโนโลยีสร้างภาพให้มีความคมชัดขึ้นที่เหมือนการทำธนบัตรปลอมให้เหมือนจริงที่สุดนั่นเอง โดยโจรจะไม่แค่ปลอมธนบัตรให้เหมือนเพียงฝ่ายเดียว แต่ยังมีโมเดลที่ทำตัวเป็นตำรวจ คอยตรวจจับว่าธนบัตรที่ออกมาเป็นของจริงหรือของปลอม ทำให้ทั้ง 2 ฝ่ายต้องพัฒนาตัวเองเสมอ เพื่อไม่ให้อีกฝ่ายตรวจจับได้

และนั่นเป็นหลักการที่ช่วยให้เกิดการสร้างภาพจาก AI ที่เหมือนจริงที่สุด และนำไปใช้ในการสร้างภาพ CT Scan ด้วย

ทั้งนี้ การสร้างรูปด้วย AI มีหลายโมเดลที่ได้รับการพัฒนาขึ้นมา แต่สิ่งที่ใช้แล้วได้ผลดีที่สุดก็คือระบบ GAN นี่เอง และเกิดสิ่งที่เรียกว่า Diffusion Models ที่สามารถสร้างภาพเหมือนจริงชนิดแยกไม่ออกว่าเป็นภาพจริง หรือภาพที่สร้างขึ้นมา

ทั้งนี้ทั้งนั้น ภาพเอกซเรย์ที่เจอบ่อยในทางการแพทย์ มักจะมี Noise รบกวนเยอะ หลักการดังกล่าวจะช่วยสร้างรูปใหม่ที่สมบูรณ์แบบขึ้นมาด้วยเทคนิค “โรยทราย” โดยให้ AI เรียนรู้จากภาพจริงที่ค่อยๆ โรยทรายลงไปบนภาพจนมองไม่เห็นชัดเจน

What is diffusion model

จากนั้นก็เรียนรู้ด้วยการ “ดูดทรายออก” ทำให้รูปเอกซเรย์ที่มองเห็นไม่ชัด ค่อยๆ ชัดเจนขึ้น สมบูรณ์แบบขึ้น กลายเป็นรูปที่เหมือนกับรูปจริงที่สุด ชนิดที่สามารถมองออกว่า ฟิล์มเอกซเรย์นั้นมองเห็นก้อนเนื้อผิดปกติหรือไม่ มีน้ำท่วมปอดหรือไม่ เป็นต้น และมันเหมือนจริงมากชนิดที่แพทย์จำนวนมากเองยังแยกไม่ออกเลยว่า ภาพที่ AI สร้างออกมา ภาพไหนเป็นภาพจริง

What is diffusion model

Generating Segmentation Masks

ประโยชน์ที่เป็นรูปธรรมก็คือ การช่วยให้ AI สร้างภาพเหมือนจริงออกมาได้ ก็ช่วยให้แพทย์ไม่จำเป็นต้องรอเรียนรู้จากของจริง แต่สามารถเรียนรู้ได้เลยโดยไม่ต้องรอให้มีผู้ป่วยจริง

Generated MRI from CT scan vs Real MRI

จริงอยู่ว่าหลายคนอาจมองว่า AI ช่วยสร้างภาพ หลายคนอาจนำมาใช้งานสนุกๆ ขำๆ แต่ในความเป็นจริงมีหลายคน หลายอาชีพเอามาใช้เพื่อสร้างประโยชน์ที่ยิ่งใหญ่กว่าเดิม แพทย์จากโรงพยาบาลศิริราช เชื่อว่านี่คือเทคโนโลยีที่จะเป็น Game Changer ช่วยแวดวงแพทย์ และนำไปสู่ความสามารถในการเติบโตทางการแพทย์ในอนาคต ช่วยคนไข้ได้มหาศาล และเปลี่ยนประเทศไทยให้เป็นประเทศที่น่าอยู่ตามมา

How to Expedite Medical AI Development in Thailand

คุณศิวดล มาตยากูร – Co-Founder, Cariva

มนุษย์แต่ละคนไม่เหมือนกัน สุขภาพของแต่ละคนก็ไม่เหมือนกัน หากวงการแพทย์หาวิธีการดูแลรักษาคนไข้แบบ Personalized Care หรือให้การรักษาที่เฉพาะตัว เหมาะสมกับร่างกายของคนไข้ได้ จะเป็นประโยชน์อย่างยิ่งต่อการรักษาผู้ป่วยให้กลับมามีสุขภาพที่แข็งแรงต่อไป

How to Expedite Medical AI Development in Thailand

ในงาน SCBX UNLOCKING AI: EP4 Computer Vision: How AI See Things Like We Do คุณศิวดล มาตยากูร, Co-Founder, Cariva มาบรรยายในหัวข้อ How to Expedite Medical AI Development in Thailand ถึงการพัฒนาของเทคโนโลยีทางการแพทย์ว่า AI นั้นสามารถช่วยแก้ปัญหาที่ว่ามานี้ในต่างประเทศได้แล้ว แต่ในไทยยังไม่สามารถทำเช่นนั้นได้ เพราะมีปริมาณข้อมูลไม่เยอะเพียงพอ

Post-surgery heart monitoring

Alzheimer Stage Prediction

ดังนั้นถ้าอยากทำให้ AI ใช้งานได้จริง ต้องเริ่มจากการสร้างระบบพื้นฐานที่รองรับการทำงานของ AI ด้วย ถ้าสามารถเชื่อมต่อกับระบบพื้นฐาน หรือระบบ Smartphone ให้ผู้คนใช้ไม่ได้ ก็ไม่เป็นประโยชน์

Thai Health Tech

แต่ถ้าทำได้ ต่อจากนี้คนไข้อาจไม่ต้องเสียเวลาไปโรงพยาบาลอีกแล้ว และจะสามารถเข้ารับการรักษาได้เลยแบบ Telemedicine จากที่บ้านได้ โดยแพทย์ยังวินิจฉัย-วิเคราะห์ข้อมูลที่มีความแม่นยำได้ในเวลาแค่ไม่กี่นาที

Medical AI Development

Solution and cores technology

คุณศิวดล ยกตัวอย่างว่าปัจจุบัน สถานที่ที่เต็มไปด้วย Data ด้านการแพทย์มากที่สุด มีข้อมูลเกี่ยวกับอาการป่วย การรักษาโรคที่มากที่สุดคือโรงพยาบาลศิริราช ที่มีการรักษาคนไข้ไม่ต่ำกว่า 3 ล้านเคสต่อปี แต่ข้อมูลเหล่านั้นกลับมีน้อยคนที่จะเข้าถึง และนำมาใช้ยกระดับทางการแพทย์ได้และต้องรอนานกว่า 1 ปีหากต้องทำเรื่องเพื่อเข้าถึงข้อมูลเหล่านั้นจริงๆ ซึ่งก็อาจสายเกินไป

Siriraj hospital network

นอกจากนั้นยังมีปัญหาเรื่อง PDPA เมื่อคนไข้ไม่อนุญาตให้เปิดเผยข้อมูลเพื่อนำไปใช้ในทางการแพทย์ ก็จะทำให้ไม่มีข้อมูลนำไปวิเคราะห์ สร้างประโยชน์ต่อไปได้

ไม่เพียงแค่คนนอกจะเข้าถึงข้อมูลไม่ได้ แต่แม้กระทั่งในโรงพยาบาลเองก็ยังมีปัญหา เข้าถึงข้อมูลของแต่ละหน่วยงานภายในไม่ได้ เพราะหน่วยงานต่างๆ มีรูปแบบการเก็บข้อมูลที่แตกต่างกันไป หากนำ AI มาช่วยงานได้จริง ก็จะต้องเสียเวลา Clean Data หรือจัดระเบียบข้อมูลอีกพักใหญ่

AI paint organ

ปัญหาอีกประการก็คือ ที่ผ่านมามีองค์กร Startup ใช้โมเดลเก็บข้อมูล Open Source จากต่างประเทศ แล้วค่อยนำมาปรับใช้กับคนไทย ผลปรากฏว่าข้อมูลที่ได้นั้นไม่สามารถปรับใช้ได้อย่างมีประสิทธิภาพ เนื่องจากบริบทของชีวิตคนไทยและชาวต่างชาติแตกต่างกัน นำมาสู่ข้อสรุปว่าประเทศไทยควรต้องมีแพลตฟอร์ม Data ของคนไทยเองเท่านั้น จึงจะสามารถนำมาใช้กับคนไทยได้อย่างมีประสิทธิภาพ

คุณศิวดล ถือโอกาสนี้กล่าวขอบคุณฐานข้อมูลจากโรงพยาบาลศิริราช ที่รวบรวมข้อมูลการรักษามากกว่า 3 ล้านเคสต่อปีมาให้ใช้ในการพัฒนา ซึ่งเป็นประโยชน์อย่างยิ่งต่อการทำงาน และหวังว่าในอนาคตอันใกล้ จะช่วยให้แพทย์ 1 คนให้การรักษาคนไข้แบบ Personalized Care ได้จริงๆ

Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies

Panelists:

  • ดร.สรรพฤทธิ์ มฤคทัต – Senior Researcher, NECTEC
  • คุณศิวดล มาตยากูร – Co-Founder, Cariva
  • นพ.ปิยะฤทธิ์ ปิยะฤทธิ์ อิทธิชัยวงศ์ – CEO & Co-Founder, PreceptorAI
  • ดร. กอบกฤตย์ วิริยะยุทธกร -President, AIEAT
  • Moderator: คุณวรวิสุทธิ์ ภิญโญยาง – Founder, insiderly.ai

ไม่บ่อยนักที่เมืองไทยจะมีการเสวนาในหัวข้อ Computer Vision ดังนั้นเมื่องาน SCBX UNLOCKING AI: EP4 Computer Vision: How AI See Things Like We Do สามารถรวมตัววิทยากรมากความรู้และความสามารถอย่างดร.สรรพฤทธิ์ มฤคทัต Senior Researcher, NECTEC, คุณศิวดล มาตยากูร, Co-Founder, Cariva, นพ.ปิยะฤทธิ์ อิทธิชัยวงศ์, CEO & Co-Founder, PreceptorAI และคุณกอบกฤตย์ วิริยะยุทธกร, President, AIEAT ให้มาอยู่บนเวทีเดียวกันได้ มั่นใจได้ว่าเนื้อหาจะต้องไม่ธรรมดาอย่างแน่นอน

สำหรับหัวข้อที่วิทยากรแต่ละท่านได้มาแลกเปลี่ยนความคิดเห็นกันครั้งนี้ว่าด้วย Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies และดำเนินรายการโดย คุณวรวิสุทธิ์ ภิญโญยาง Founder, insiderly.ai

Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies

Computer Vision เทคโนโลยีช่วยศึกษาอดีต เปลี่ยนโลก

สำหรับประเด็นแรกที่วิทยากรได้ถกเถียงกันนั้นว่าด้วยประโยชน์ของเทคโนโลยี Computer Vision คุณกอบกฤตย์ อธิบายว่านี่คือเทคโนโลยีที่จะช่วยให้เข้าใจหลายศาสตร์มากขึ้น ไม่ว่าจะเป็นงานวิทยาศาสตร์ งานสำรวจอวกาศ ไปจนถึงงานประวัติศาสตร์ ทั้งการศึกษาการใช้ภาษาในอดีต และศึกษาการใช้ภาษาของสรรพสิ่งในธรรมชาติ

โดยความรู้ในเรื่องหลังสุดนี้มีผู้ศึกษาเรื่องราวที่น่าสนใจเยอะมาก เช่น การทำความเข้าใจว่าผึ้งสื่อสารกันอย่างไรในรัง ช่วยให้เข้าใจความเป็นไปของธรรมชาติมากขึ้น และเกิดปัญญาที่มากขึ้นตามไปด้วย

ขณะที่ นพ.ปิยะฤทธิ์ เสริมว่า Computer Vision ทำงานเหมือนกับตาของคนเรา และมาช่วยให้เข้าใจภาพที่เราเห็นไม่ชัดเจนได้มากขึ้น รวมถึงการช่วยให้งานที่เคยน่าเบื่อ ยุ่งยาก ซ้ำซ้อน เช่น งานเอกสาร สามารถเสร็จสิ้นได้ในเวลาที่รวดเร็วกว่าเดิมหลายเท่า มีเวลาไปทำงานสร้างนวัตกรรมใหม่ ๆ มากขึ้นกว่าเดิม

Computer Vision เทคโนโลยีช่วยยกระดับการแพทย์

สืบเนื่องจากการบรรยาย 2 หัวข้อก่อนหน้าที่ว่าด้วยการใช้ประโยชน์ Computer Vision ในทางการแพทย์ แสดงให้เห็นว่ามีนวัตกรรมใหม่ๆ พร้อมเกิดขึ้นเสมอ ด้วยความคิดสร้างสรรค์ของคนจำนวนมาก หนึ่งในนั้นก็คือเทคโนโลยีที่ช่วยให้ผู้พิการทางสายตาสามารถมองเห็นได้ชัดเจนขึ้น

ดร.สรรพฤทธิ์ ยกตัวอย่างว่าย้อนกลับไปประมาณ 6-7 ปีก่อน เคยมีคนเปิดบริษัทเพื่อทำแว่น Google Glass ที่ช่วยคนตาบอดรู้ว่าไฟในห้องเปิดอยู่หรือไม่ เสื้อและกางเกงที่ใส่ในแต่ละวันมีความเข้ากันไหม ซึ่งแค่นี้ก็ถือว่าน่าทึ่งแล้ว

ส่วน นพ.ปิยะฤทธิ์ ให้ความเห็นเพิ่มว่าปัจจุบันมีแอปพลิเคชันชื่อ Be My Eyes ช่วยให้ผู้พิการทางสายตาได้มองเห็นภาพนิ่งตรงหน้าชัดเจนขึ้น พร้อมเสียงบรรยายประกอบ ซึ่งสามารถช่วยให้ผู้ใช้งานมองเห็นโลกได้สดใสกว่าเดิม สามารถใช้ชีวิตใกล้เคียงกับคนปกติ แต่ลองจินตนาการว่าหากในอนาคตเทคโนโลยีนี้วิวัฒนาการไปอีกขั้น จะน่าตื่นตาเพียงใด

Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies

“ในอดีตการจะบอกว่า เทคโนโลยียังบอกยากว่าวัตถุตรงหน้าเราเป็นสุนัขหรือแมว แต่ด้วยงานวิจัยด้าน Image Captioning ที่พัฒนาขึ้นอย่างต่อเนื่อง ช่วยให้เกิดพัฒนาการการศึกษาด้านนี้มหาศาล แต่ก็ยังมีความท้าทายรออยู่อีกเยอะ เช่น ถ้าพัฒนาต่อเป็นงานวิดีโอ ภาพเคลื่อนไหว จะทำอย่างไรให้คำอธิบายออกมาเจ๋ง ไหนจะต้องทำคำบรรยายเป็นภาษาต่างๆ ตามมาด้วย”

ถึงเทคโนโลยีช่วยคนไข้วินิจฉัยโรคเองได้ แต่โลกนี้ยังต้องมีหมอ ว่ากันว่า AI ปัญญาประดิษฐ์จะเข้ามาทำให้คนตกงานมากขึ้น บ้างก็บอกว่าคนที่ใช้ AI จะไม่ตกงาน แต่คนที่ไม่ใช้ต่างหากที่จะต้องเผชิญสภาวะนั้น

คำถามที่น่าคิดก็คือ แล้วคนเป็นหมอล่ะ จะมีโอกาสตกงานหรือไม่ หากว่าเทคโนโลยีพัฒนาไปไกลจนถึงขั้นที่คนไข้วินิจฉัยโรคได้เอง โดยไม่ต้องพึ่งความคิดเห็นผู้เชี่ยวชาญตัวจริง

ดร.สรรพฤทธิ์ คิดว่า มีโอกาสในระดับหนึ่งว่าคนไข้จะสามารถดูแลรักษาตัวเองได้โดยไม่ต้องพึ่งพาหมอ หากเป็นโรคหรืออาการป่วยที่ไม่ร้ายแรงอาการส่วนใหญ่ถ้าไม่ฉุกเฉิน แต่ในความเป็นจริงแล้ว เวลาหมอรักษาคนไข้ จะไม่แค่ดูภาพเอกซเรย์แล้วให้ยาเลย แต่จะต้องซักประวัติ อาศัยข้อมูลภาพ เสียง ตัวอักษรที่มีความครบถ้วนเพียงพอในการวิเคราะห์ มิฉะนั้นอาจเกิดปัญหา และไม่สามารถรักษาให้หายขาดได้

Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies

ส่วนคุณศิวดล มองว่า ถ้าวันหนึ่งมีสิ่งที่ทำให้วินิจฉัยด้วยตัวเองได้จริงๆ ก็ถือเป็นเรื่องดี เพราะน่าจะช่วยแบ่งเบาภาระหมอไปได้บ้าง หรือในอีกทางหนึ่งก็จะช่วยหมอสกรีนคนไข้เบื้องต้นได้ว่า ใครควรรับการรักษาเร่งด่วน ทำให้ผู้ป่วยรู้จักดูแลตัวเองและคนรอบข้างมากขึ้น และไม่ปล่อยให้อาการหนักจนสายเกินกว่าจะช่วยเหลือได้

ทุกการถือกำเนิดของเทคโนโลยีที่ยิ่งใหญ่ ย่อมมีอุปสรรคขวางกั้น

การจะพัฒนาเทคโนโลยีล้ำสมัยให้ประสบความสำเร็จแต่ละอย่าง รวมถึง Computer Vision ขึ้นมาได้ ต้องอาศัยปัจจัยหลายอย่างเพื่อผลักดัน ไม่ว่าจะเป็นเวลา เงินทุนสนับสนุน ไปจนถึงข้อมูลที่เพียงพอต่อการค้นคว้าข้อมูลเพิ่มเติม หากขาดสิ่งใดสิ่งหนึ่งไปก็อาจทำให้ไอเดียดีๆ นวัตกรรมที่มีประโยชน์ไม่สามารถเกิดขึ้นได้

ในความคิดของ ดร.กอบกฤตย์ มองว่า ทุกสรรพสิ่งล้วนมีวัฏจักรของมัน แต่สำหรับเทคโนโลยีอย่าง Computer Vision นั้นฝ่าฟันอุปสรรคมาอยู่ในช่วงที่กำลังเติบโตแบบขาขึ้นเรื่อยๆ โดยเฉพาะ 5 ปีที่ผ่านมาเพราะเกิดนวัตกรรมใหม่ๆ ทุกวัน ช่วยแก้ไขฟังก์ชันการทำงานแต่ละส่วนให้มีความแม่นยำขึ้นเรื่อยๆ แม้หลายอย่างยังไม่สามารถนำไปใช้ในชีวิตประจำวันได้เต็มตัว แต่หลายอย่างก็สามารถใช้งานได้จริงแล้ว และน่าจะได้เห็นสิ่งดีๆ เกิดขึ้นอีกมากมายนับไม่ถ้วนในอนาคตอันใกล้

Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies

ขณะที่คุณศิวดล มองว่าอุปสรรคใหญ่ของงาน Computer Vision มี 2 อย่างด้วยกันดังนี้

  1. นำไปใช้งานในชีวิตจริงไม่ได้ เพราะไม่สามารถเข้าถึงข้อมูลที่เพียงพอ เช่น ในแวดวงแพทย์ หากปราศจากข้อมูลของผู้ป่วย ข้อมูลการรักษาคนไข้ การจะพัฒนาเทคโนโลยีที่ช่วยชีวิตผู้คนได้ก็จะยากขึ้นตามไปด้วย
  2. เกิดกรณีจริงที่มีประโยชน์ทางธุรกิจน้อย Co-Founder จาก Cariva มองว่าองค์กร Startup ที่มีไอเดียดีๆ แต่มีไม่กี่ไอเดียเท่านั้นที่สร้างรายได้ให้กับองค์กรได้ ต่อให้จะมีความคิดสร้างสรรค์ใหญ่โตว่าจะนำ AI มาใช้ยกระดับคุณภาพชีวิต แต่ถ้าไม่สามารถสร้างเงินสร้างทองได้ ก็จะไม่มีใครเอาไปใช้งานต่อ ซึ่งหากเกิดกรณีศึกษาในการใช้งานจริงมากขึ้น คนก็จะได้แรงบันดาลใจ แล้วนำไปพัฒนาสิ่งต่อยอดสิ่งดีๆ ให้เกิดขึ้นอีกมากมายตามมา

ส่วนในความคิดของ นพ.ปิยะฤทธิ์ มองว่า หลายคนอาจคิดว่าการไม่มีความรู้เรื่องการเขียนโปรแกรมเป็นเรื่องสำคัญ แต่จริงๆ แล้วอุปสรรคใหญ่หลวงมากกว่าคือการขาดความรู้ด้านภาษาอังกฤษ ขอเพียงเข้าใจภาษาอังกฤษ ก็จะสามารถสั่งงาน AI และเข้าถึงองค์ความรู้ที่กว้างไกลขึ้นกว่าเดิมหลายเท่า

ดังนั้น ต้องขจัดความกลัวด้านภาษา และกล้าใช้ประโยชน์จากมัน ก็จะมีลู่ทางที่ไปต่อได้อีกมากมาย

อนาคตสุดท้าทาย ที่ใครก็คาดการณ์ไม่ง่าย

ในโลกที่เทคโนโลยีพัฒนาไปเร็ว ชนิดที่แค่ 1 ปีหลายสิ่งหลายอย่างก็เปลี่ยนแปลงไปมากโขจนตามไม่ทันแล้ว แต่หากให้วิทยากรทุกคนลองคาดการณ์อนาคตว่าจะเป็นอย่างไร ซึ่งแต่ละคนนั้นให้ความเห็นที่น่าสนใจทีเดียว

เริ่มจาก ดร.สรรพฤทธิ์ มองว่า เมื่อ 1 ปีก่อนมีหลายเทคโนโลยีที่ไม่มีใครเคยใช้มาก่อน แต่ปัจจุบันกลายเป็นสิ่งแพร่หลาย การจะคาดการณ์ 1 ปีต่อไปจะเป็นอย่างไรอาจจะยากมาก แต่เชื่อว่าการแข่งกันเรื่อง Large Language Model (LLM) จะดุเดือดยิ่งขึ้น เมื่อทุกค่ายพยายามทำให้ออกมาใช้งานง่ายที่สุด ซึ่งจะเป็นเช่นนั้นหรือไม่ ยังต้องติดตามกันต่อไป

Future of Computer Vision: Trends and Integration of Computer Vision With Other AI Technologies

ส่วนคุณกอบกฤตย์ เสริมว่า หนึ่งในเทคโนโลยีที่ไม่มีใครใช้เมื่อปี 2022 แต่แพร่หลายมากๆ ในปีนี้ก็คือ Generative AI นั่นเอง และไม่มีใครคาดคิดว่าจะได้รับความนิยมมากขนาดนี้ และในเมื่อ 1 ปีที่ผ่านมา AI วิวัฒนาการไปมาก ก็อาจเป็นไปได้ว่าภายในปี 2030 เราอาจจะได้เห็น AGI หรือ Artificial General intelligence ที่ฉลาดล้ำ สามารถเรียนรู้สิ่งต่างๆ ได้ด้วยตัวเอง โดยไม่ต้องรอให้ใครมาป้อนข้อมูลที่ใช้งานได้จริงก็เป็นได้

CEO & Co-Founder, PreceptorAI เชื่อว่า AI จะช่วยชีวิตคนได้เยอะมาก จากที่คนไข้จะต้องรอคิวทำ MRI นานอย่างน้อย 2 สัปดาห์จึงจะได้รับการวินิจฉัย การมีสิ่งเหล่านี้มากระตุ้นจะส่งผลดีต่อการเติบโตในอนาคตมากๆ และ AI มาช่วยก็จะทำให้ได้เงินมากขึ้น ในเวลาที่เร็วขึ้น ไม่เพียงแค่หมอ แต่ยังรวมถึงคนทุกอาชีพ ดังนั้นถ้าไม่รีบปรับตัวหรือทำอะไรมากกว่าที่ AI ทำได้ตอนนี้ ในเวลาอีกไม่กี่ปีข้างหน้าความเสี่ยงที่จะตกงานหรือถูกกลืนหายไปย่อมมากขึ้นหลายเท่า

ขณะที่คุณศิวดล เชื่อว่าอีกไม่นานจะเกิดการ Adoption ในวงกว้าง หรือการที่ทุกคนใช้งาน AI ได้เกิดประโยชน์มากขึ้น เพราะใช่งานง่ายขึ้น ช่วยให้เกิดความรู้สึกดีกับมันมากขึ้น จากที่ไม่เคยอยากใช้ ไม่กล้าใช้ ก็จะกล้าลองใช้มากขึ้น

“เราต้องเรียนรู้ที่จะอยู่กับ AI ไม่ว่าจะเขียนโปรแกรม โน้ต ทำรีพอร์ต แต่สิ่งสำคัญที่ต้องมีคือความคิดสร้างสรรค์ เรามี AI ช่วยงาน ร่วมกันสร้างสิ่งใหม่ที่ยังไม่เคยมีมาก่อน สิ่งที่ยังไม่เคยทำได้ในอดีต ถ้าทำได้ มนุษย์จะอยู่นำหน้า AI แต่ถ้าไม่ เราจะถูกทดแทนด้วย AI และคนที่เก่งในการใช้งาน AI” คุณศิวดลทิ้งท้าย

More Insights for you

Stay up to date with our latest content

Our interested news more

Up to date with our interested news