ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว
ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว |
|||||||
สุดยอดความสามารถใหม่! ChatGPT ของ OpenAI สามารถใช้เสียงและรูปภาพในการสอบถามคำถามได้แล้ว! ตอนนี้คุณสามารถสนทนาด้วยเสียงกับ Chatbot ได้เลย และยังสามารถถ่ายภาพและสนทนาเกี่ยวกับภาพเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับสิ่งที่คุณกำลังมองอยู่ได้อีกด้วย!
|
เปิดตัว Chatbot รุ่นใหม่จาก OpenAI! คุณสามารถพูดคำถามหรือคำสั่งให้กับ Chatbot และระบบจะแปลงเสียงของคุณให้เป็นข้อความ เราใช้โมเดล Whisper ของ OpenAI ในการแปลงคำพูดเป็นข้อความ โดยโมเดลนี้สามารถสร้างเสียงที่เหมือนมนุษย์ได้จากเสียงพูดตัวอย่างเพียงไม่กี่วินาทีเท่านั้น!
รูปภาพจาก freepik
และที่สำคัญ! เราได้ร่วมมือกับนักพูดมืออาชีพเพื่อสร้างเสียงที่เกี่ยวข้องกับประสบการณ์ใหม่นี้ คุณสามารถเลือกเสียงที่คุณชื่นชอบได้จาก 5 เสียงที่มีชื่อที่เป็นธรรมชาติเช่น "Juniper", "Ember", "Sky", "Cove", และ "Breeze" ซึ่งเสียงทั้งหมดมีทั้งเพศชายและเพศหญิง มีความชัดเจนและออกทัศนะได้ดี เหมาะสำหรับการเล่านิทาน อ่านข่าว หรือแค่สนทนากันเพื่อความสนุกสนาน!
รูปภาพจาก freepik
OpenAI ยังร่วมมือกับ Spotify เพื่อทดลอง Voice Translation ซึ่งใช้โมเดลเสียงใหม่เพื่อช่วยให้ผู้ทำรายการพ็อดคาสต์สามารถแปลภาษาของตนเองได้ด้วยเสียงของตนเอง! ฟีเจอร์ Voice Translation จะเปิดให้ใช้งานสำหรับผู้ใช้ ChatGPT Plus และ Enterprise ในระยะเวลาสองสัปดาห์ข้างหน้า ในโปรแกรม iOS และ Android ผ่านการเปิดใช้งานแบบ Opt-in เพื่อเริ่มต้นใช้งาน คุณสามารถค้นหาฟีเจอร์ใหม่นี้ในส่วน New Features ที่เมนูตั้งค่าของแอปมือถือ และเปิดใช้งานได้โดยการแตะปุ่มหูฟัง!
รูปภาพจาก freepik
ไม่เพียงแค่เสียง! คุณยังสามารถใช้ภาพเพื่อให้ ChatGPT มีประสิทธิภาพมากยิ่งขึ้น! คุณสามารถถ่ายภาพทั้งฉาก วัตถุ หรืออะไรก็ตาม แล้วสอบถาม Chatbot เกี่ยวกับสิ่งที่คุณกำลังมองเห็นเพื่อแก้ปัญหาคณิตศาสตร์ที่ซับซ้อน ประกอบเป็นเตียงนอน รับรู้เกี่ยวกับสถานที่สำคัญ หรือหาทิศทางไปยังสถานที่ที่อยู่ไกลแห่งหนึ่ง!
เช่น เมื่อคุณเปิดตู้เย็นแล้วถ่ายภาพว่ามีอะไรบ้าง แล้วถามว่าคุณสามารถทำอาหารอะไรกินได้บ้าง หากมีส่วนผสมที่เห็นได้เพียงพอ คุณสามารถเดินทางไปร้านค้าและได้รับข้อมูลเกี่ยวกับสินค้าจาก ChatGPT โดยการถ่ายภาพสินค้าและเปรียบเทียบราคา และอีกอย่างหนึ่งคุณสามารถถ่ายภาพเครื่องทำอาหารบาร์บีคิวที่อยู่ในโรงรถที่คุณไม่สามารถใช้ได้ตลอดช่วงฤดูหนาว เพื่อขอความช่วยเหลือจาก ChatGPT เพื่อค้นหาคู่มือและช่วยให้คุณใช้งานเครื่องทำอาหารได้อีกครั้ง! รูปภาพจาก freepik
ความสามารถใหม่นี้เป็นการอัพเกรดจากความสามารถเดิมที่อยู่ในตลาดอยู่แล้ว เช่น Google Lens ซึ่งให้การค้นหาภาพที่มีประสิทธิภาพสามารถระบุสิ่งที่อยู่ในภาพได้ และ Google DeepMind ได้พัฒนาโมเดล AI สำหรับผู้ที่มีปัญหาด้านการมองเห็นด้วย Lookout on Android โดยใช้โมเดล AI ที่อธิบายภาพเพื่อให้ผู้ใช้สามารถถามคำถามเพิ่มเติมเกี่ยวกับภาพได้
การพัฒนาความสามารถใหม่นี้ของ OpenAI ได้รับแรงบันดาลใจจากการใช้แอปสำหรับผู้ที่มีปัญหาด้านการมองเห็นชื่อ Be My Eyes ซึ่งเป็นแอปมือถือฟรีที่ใช้เทคโนโลยี GPT-4 เพื่อช่วยให้ผู้มีปัญหาด้านการมองเห็นได้รับความช่วยเหลือ การเชื่อมต่อรูปภาพในชีวิตจริงกับการค้นหาในอินเทอร์เน็ตและการสนทนากับ Chatbot ทำให้คุณสามารถทำได้มากกว่าที่เคยเป็น! |