โลกไอทีวันนี้ (World IT Today)

Google เปิดตัว 'Gemini Omni' โมเดล AI ใหม่ล่าสุด สร้างสรรค์วิดีโอและคอนเทนต์ได้จาก "ทุกอินพุต"


ตอนนี้เราสามารถแก้ไขวิดีโอได้เพียงแค่พูดคุยกับ AI

👉 เปลี่ยนมุมกล้อง ฉาก แสง และการกระทำต่างๆ ในหลายๆ คำสั่ง โดยคงตัวบุคคลเดิมเอาไว้ได้

👉 ผสมผสานข้อความ รูปภาพ เสียง ภาพร่าง และฟุตเทจที่มีอยู่ เพื่อสร้างวิดีโอระดับภาพยนตร์จากเกือบทุกอย่าง


ในงาน Google I/O 2026 ที่ผ่านมา ท่ามกลางการเปิดตัวฟีเจอร์ AI มากมาย ไม่ว่าจะเป็นการนำ AI ไปผสานกับ Google Search, โมเดล Gemini 3.5 หรือผู้ช่วยส่วนตัวใหม่อย่าง Gemini Spark ทาง Google ได้สร้างความฮือฮาอีกครั้งด้วยการเปิดตัว Gemini Omni โมเดล AI อัจฉริยะที่สามารถ "สร้างสรรค์ได้ทุกอย่างจากทุกอินพุต — โดยเริ่มต้นที่วิดีโอ"

Google อธิบายว่า Gemini Omni คือ "ก้าวต่อไป" ที่พัฒนาต่อยอดมาจากโมเดลก่อนหน้าอย่าง Nano Banana และ Veo 3.1 ความสามารถที่โดดเด่นที่สุดคือการอนุญาตให้ผู้ใช้ "ผสมผสานรูปภาพ, เสียง, วิดีโอ และข้อความ" เพื่อสร้างสรรค์วิดีโอคุณภาพสูงออกมาได้ตามต้องการ ไม่เพียงแค่นั้น ผู้ใช้ยังสามารถตัดต่อและแก้ไขวิดีโอเหล่านั้นได้ง่ายๆ ผ่านการป้อนคำสั่งภาษาธรรมชาติ (Natural Language)


ตัวอย่างเช่น คุณสามารถถ่ายวิดีโอสั้นๆ จากนั้นสั่งให้ Omni เปลี่ยนแปลงเนื้อหาในวิดีโอ เพิ่มตัวละครหรือวัตถุใหม่ๆ เข้าไป หรือแม้กระทั่งเปลี่ยนจังหวะธรรมดาๆ ให้กลายเป็นเหตุการณ์ที่ไม่คาดฝันได้ในพริบตาเดียว

🔴 ยกระดับความสมจริงด้วยความเข้าใจฟิสิกส์พื้นฐาน


หนึ่งในจุดอ่อนของ AI สร้างวิดีโอที่ผ่านมาคือความไม่สมจริง (Uncanny Valley) แต่ในช่วงคีย์โน้ตของงาน Google ได้เน้นย้ำว่า Omni ได้รับการพัฒนาให้เข้าใจเรื่องของแรงโน้มถ่วง (Gravity), พลศาสตร์ของไหล (Fluid Dynamics) และ พลังงานจลน์ (Kinetic Energy) ได้ดีขึ้นมาก ส่งผลให้คอนเทนต์ AI ที่ถูกสร้างออกมานั้นมีการเคลื่อนไหวที่ดูเป็นธรรมชาติและสมจริงกว่าที่เคย

อย่างไรก็ตามคงต้องรอดูกันต่อไปว่าเมื่อนำมาใช้งานจริง โมเดลนี้จะสามารถลบภาพความแปลกตาแบบ AI เดิมๆ ออกไปได้ทั้งหมดหรือไม่

และเพื่อความโปร่งใสและป้องกันการนำไปใช้ในทางที่ผิด คอนเทนต์ทั้งหมดที่สร้างขึ้นด้วยโมเดล Omni จะถูกฝังลายน้ำดิจิทัล (SynthID) ของ Google เพื่อเป็นการระบุอย่างชัดเจนว่าคอนเทนต์ชิ้นนี้มีองค์ประกอบของ AI และถูกสร้างขึ้นโดย Gemini Omni

🔴 ความพร้อมใช้งาน

โมเดลรุ่นแรกที่จะถูกปล่อยออกมาคือ Gemini Omni Flash ซึ่งพร้อมให้บริการแล้ววันนี้สำหรับผู้ใช้แอปพลิเคชัน Gemini, Google Flow และกำลังจะทยอยเปิดตัวบน YouTube Shorts รวมถึงแอป YouTube Create ภายในสัปดาห์นี้

โดยสิทธิ์การใช้งานนั้นจะเปิดให้ครอบคลุมสำหรับผู้ที่เป็นสมาชิก Google AI ระดับ Plus, Pro และ Ultra ทั่วโลก


สรุปสั้นๆ Omni คือโมเดลใหม่ที่สามารถสร้างสรรค์สิ่งใดก็ได้จากอินพุตใดๆ ก็ได้ โดยเริ่มต้นจากวิดีโอ (นึกถึง Nano Banana แต่ใช้สำหรับวิดีโอ) 

Source : XDA
Article By : โลกไอทีวันนี้ 
โลกไอทีวันนี้

อัพเดทข่าวสารวงการไอทีแบบรวดเร็วทันใจ ช่องทางอื่นๆ www.facebook.com/worldittoday

Post a Comment (0)
Previous Post Next Post