Microsoft AI วาดวัตถุจากคำอธิบายข้อความ

ตามบทความทางวิชาการที่ตีพิมพ์โดยนักวิจัยของ Microsoft ซอฟต์แวร์ปัญญาประดิษฐ์ใหม่ที่พัฒนาที่ Microsoft สามารถ "ดึง" สิ่งใดก็ได้จากคำอธิบายที่เป็นข้อความ ตัวอย่างเช่นหากผู้ใช้ขอให้คอมพิวเตอร์“ วาดนกสีเหลืองที่มีปีกสีดำและจะงอยปากขนาดเล็ก” ผลลัพธ์จะเป็นสิ่งที่คุณเห็นในภาพ

นกเหล่านี้อาจไม่มีอยู่จริงในโลกพวกมันเป็นเพียงส่วนหนึ่งของจินตนาการคอมพิวเตอร์ของเราเกี่ยวกับนก

“ ถ้าคุณเปิด Bing Bird Search คุณจะเห็นรูปนก แต่ที่นี่ภาพถ่ายถูกสร้างขึ้นโดยคอมพิวเตอร์พิกเซลต่อพิกเซลตั้งแต่เริ่มต้น” Xiaodong He ผู้นำการวิจัยของไมโครซอฟท์ให้ความเห็นกับสิ่งพิมพ์อย่างเป็นทางการของไมโครซอฟท์ให้ความเห็น “ นกเหล่านี้อาจไม่มีอยู่จริงในโลกพวกมันเป็นเพียงส่วนหนึ่งของจินตนาการของคอมพิวเตอร์ของเรา” เขากล่าวเสริม

เขาให้รายละเอียดเพิ่มเติมว่าผลลัพธ์ในปัจจุบันที่คอมพิวเตอร์นำมาใช้นั้นไม่สมบูรณ์ แต่สามารถเข้ามาใกล้ได้ แนวคิดก็คือซอฟต์แวร์อัจฉริยะดังกล่าวสามารถทำหน้าที่เป็นผู้ช่วยออกแบบสำหรับศิลปินหรือนักออกแบบตกแต่งภายในได้ในที่สุด

ไมโครซอฟท์

ในอนาคตผู้เชี่ยวชาญดังกล่าวอาจถ่ายภาพสภาพแวดล้อมภายในบ้านแล้วขอคอมพิวเตอร์: "เพิ่มเก้าอี้เท้าแขนทำจากไม้สีเทาสไตล์โมเดิร์นในมุมซ้าย" คอมพิวเตอร์ไม่เพียง แต่ช่วยตั้งค่าสภาพแวดล้อม แต่ยังสร้างเฟอร์นิเจอร์และองค์ประกอบอื่น ๆ

กระบวนการ

การวิจัยครั้งแรกโดยทีมงานที่ทำงานในโครงการนี้ที่ Microsoft เริ่มต้นด้วยการทดลองกับ CaptionBot ระบบปัญญาประดิษฐ์ที่สามารถเขียนคำอธิบายภาพสำหรับภาพใด ๆ จากนั้นพวกเขาก็สร้างซอฟต์แวร์ AI อื่นที่สามารถตอบคำถามของผู้คนเกี่ยวกับภาพถ่าย SeenAI ซึ่งมีประโยชน์อย่างยิ่งสำหรับผู้พิการทางสายตา

ในที่สุดกลุ่มสามารถพัฒนาเทคโนโลยีที่สามารถสร้างภาพวาดเหล่านี้จากคำอธิบายที่เป็นข้อความ ส่วนแรกเรียกว่า Generative Adversarial Network (GAN) ออกแบบมาเพื่อสร้างภาพและส่วนที่สองเรียกว่า "Discriminator" ซึ่งเป็นผู้ตัดสินคุณภาพของภาพถ่าย

ความสนใจคือแนวคิดของมนุษย์ เราใช้คณิตศาสตร์เพื่อให้ความสนใจแนวคิดการคำนวณ

ระบบนี้ได้รับการฝึกฝนด้วยภาพคำบรรยายคู่เพื่อให้ซอฟต์แวร์สามารถเข้าใจว่าคำใดตรงกับภาพใด ต่อมามีความจำเป็นต้องสร้างแบบจำลองทางคณิตศาสตร์เพื่อมุ่งเน้นไปที่การสร้างที่พัฒนาโดยระบบ “ ความสนใจคือแนวคิดของมนุษย์ เราใช้คณิตศาสตร์เพื่อให้ความสนใจแนวคิดการคำนวณ” เขากล่าว

นักวิจัยเชื่อว่าในที่สุดมันจะเป็นไปได้ในการสร้างภาพยนตร์การ์ตูนจากสคริปต์ที่เขียนขึ้นโดยใช้ระบบเช่นนี้ แต่เราไม่มีการคาดการณ์ว่าเมื่อใดก็ตามที่ประเภทนี้อาจนำไปใช้ในเชิงพาณิชย์กับผลิตภัณฑ์ Microsoft ใด ๆ

วัตถุ“ ดึง” ของ Microsoft AI จากคำอธิบายข้อความผ่าน TecMundo