Công Nghệ

Tiến sĩ Việt tại Google dùng AI chuyển văn bản thành ảnh

Tiến sĩ Lương Minh Thắng và 10 chuyên gia tại Google Brain đã xây dựng mô hình Parti, dạy trí tuệ nhân tạo vẽ hình dựa trên các từ mô tả.

Tiến sĩ Thắng (34 tuổi), là người Việt Nam duy nhất trong nhóm nghiên cứu chủ chốt về mô hình Parti (Pathways Autoregressive Text-to-Image) – tự chuyển văn bản thành hình ảnh tại Google Brain vào đầu năm 2021. Ngôn ngữ thông dụng trong giao tiếp của con người, nhưng “nếu ứng dụng công nghệ để tạo ra những bức ảnh, bức tranh sáng tạo thì có thể coi đây là một bước tiến mới của AI”, TS Thắng nói.

Tiến sĩ Lương Minh Thắng hiện làm việc cho Google Brain, chuyên phát triển các sản phẩm AI.  Ảnh: NVCC

Tiến sĩ Lương Minh Thắng hiện làm việc cho Google Brain, chuyên phát triển các sản phẩm AI. Hình ảnh: NVCC

Anh chia sẻ, các mô hình AI hiện nay được ứng dụng trên các ngôn ngữ thông qua mô hình chatbot có thể tương tác với con người bằng văn bản. Trong lĩnh vực hình ảnh, AI có thể nhận dạng các đối tượng trong ảnh. “Nếu kết hợp hai việc này để chuyển đổi ngôn ngữ dạng văn bản thành hình ảnh sẽ tạo ra một mô hình AI rất hiện đại, hỗ trợ đắc lực cho con người trong lĩnh vực sáng tạo hình ảnh”, TS Thắng nói. lý do làm mô hình Parti.

Mô hình Parti cho phép tạo ra các hình ảnh đúng như mô tả và mong muốn của người dùng. Công nghệ này có thể giúp những người chuyên về sáng tạo ảnh như nghệ sĩ, nhiếp ảnh gia, nhà thiết kế thời trang, đồ họa,… Khi có ý tưởng cho bức ảnh, bạn chỉ cần viết dòng chữ. những chi tiết mong muốn, AI sẽ phân tích và đưa ra bức tranh gợi ý cho ý tưởng đó giúp các em tăng khả năng sáng tạo. Chỉ cần thay đổi một câu, từ hoặc chi tiết trong văn bản có thể dẫn đến một bức tranh khác.

Ảnh do AI tạo dựa trên mô tả bằng văn bản bên dưới.  Ảnh chụp màn hình

Ảnh do AI tạo dựa trên mô tả bằng văn bản bên dưới. Ảnh chụp màn hình

Để tạo ra mô hình Parti, TS Thắng và các chuyên gia của Google lần lượt sử dụng hàng trăm triệu cặp dữ liệu hình ảnh văn bản để đào tạo mô hình AI. Dữ liệu được sử dụng từ các trang web, được xử lý bởi một mạng nơ-ron nhân tạo với sức chứa khoảng 20 tỷ nơ-ron. “Dựa trên dữ liệu văn bản và hình ảnh, AI sẽ kết hợp để tạo ra một bức ảnh mới, giúp mọi người có những ý tưởng mới”, TS Thắng nói.

Các chủ đề được mô hình Parti thể hiện nhiều nhất là thiên nhiên, động vật, đồ vật … Trên trang web Google Research, nhiều hình ảnh được tạo ra từ AI giống như ảnh thật.

Theo nhóm nghiên cứu, với những hình ảnh liên quan đến con người đều được nhóm xử lý cẩn thận trên nguyên tắc không gây ảnh hưởng tiêu cực đến cộng đồng về giới tính, dân tộc, tôn giáo …

Tranh sơn dầu theo phong cách của họa sĩ nổi tiếng Van Gogh do AI thực hiện.  Ảnh chụp màn hình

Tranh sơn dầu theo phong cách của họa sĩ nổi tiếng Van Gogh do AI thực hiện. Ảnh chụp màn hình

Nhược điểm hiện tại là với các tài liệu quá dài, mô tả quá nhiều chi tiết, hoặc mô tả các hình ảnh mâu thuẫn nhau (như biển cạnh sa mạc), AI có thể hiểu sai hoặc không đưa ra kết quả.

Tiến sĩ Thắng cho biết, thời gian tới, nhóm sẽ khắc phục hạn chế này để xây dựng một mô hình AI hoàn chỉnh. Nhóm nghiên cứu cân nhắc việc đào tạo AI có thể chỉnh sửa hình ảnh theo yêu cầu trên văn bản của người dùng để phục vụ họ tốt hơn, cũng như nghiên cứu để tạo video từ nhiều bức ảnh có nội dung tương tự.

Lương Minh Thắng từng là học sinh chuyên Toán trường THPT Năng khiếu, Đại học Quốc gia TP.HCM. Sau khi tốt nghiệp trung học, anh theo học ngành khoa học máy tính tại Đại học Quốc gia Singapore. Năm 2011, anh nhận học bổng Tiến sĩ tại Đại học Stanford (Mỹ). Vào tháng 9 năm 2016, anh chính thức làm việc tại Google Brain với chuyên môn về học máy và xử lý ngôn ngữ tự nhiên.

Hà An

Nguồn: https://vnexpress.net/tien-si-viet-tai-google-dung-ai-chuyen-van-ban-thanh-anh-4500864.html

Tin Tức 7S

Tin tức 7s: Cập nhật tin nóng online Việt Nam và thế giới mới nhất trong ngày, tin nhanh thời sự, chính trị, xã hội hôm nay, tin tức chính thống VN.Cập nhật tin tức 24/7: Giải trí, Thể thao...tại Việt Nam & Thế giới hàng ngày. Thông tin, hình ảnh, video clip HOT cập nhật nhanh & tin cậy nhất.

Related Articles

Back to top button