ค้นหาใน SCBX

แนะนำในเว็บไซต์ SCBX

Typhoon OCR: Open Vision-Language Model For Thai Document Extraction

SCB 10X introduces Typhoon OCR, an open vision-language model fine-tuned on a Thai-focused dataset using a multi-stage data construction pipeline. The model provides a unified framework capable of performing text translation, key-value extraction, and structured document parsing for both Thai and English.

By |2026-06-23T11:26:12+07:0022/06/2026|Human-Intelligence|0 Comments

Typhoon Isan: Open-Source ASR and a Language Technology Suite for Thailand’s Largest Dialect

SCB 10X พัฒนา Typhoon Isan ซึ่งเป็น AI แบบโอเพนซอร์สตัวแรกของประเทศไทยที่สามารถเข้าใจภาษาอีสาน โดยผสานชุดข้อมูลที่มีประโยชน์ มาตรฐานการถอดเสียงที่ชัดเจน และโมเดลแปลงเสียงเป็นข้อความ (Speech-to-Text) ที่รองรับทั้งการประมวลผลแบบเรียลไทม์และความแม่นยำสูงเข้าด้วยกัน

By |2026-06-23T11:27:14+07:0022/06/2026|Human-Intelligence, Exclusive|0 Comments

Extending Audio Context for Long-Form Understanding in Large Audio-Language Models

This Research by SCBX Group and partners introduces Partial YaRN, a training-free position interpolation method that modifies only audio token positions while keeping text embeddings intact. The technique extends the context window, allowing processing of longer speech and audio tracks.

By |2026-06-23T11:28:29+07:0022/06/2026|Human-Intelligence|0 Comments
Go to Top