AI ngày càng phát triển, có thể biến lời nói thành hình ảnh

Theo CNBC, DALL-E là một công nghệ cho phép người dùng tạo hình ảnh kỹ thuật số chỉ đơn giản bằng cách mô tả những gì mình mong muốn nhìn thấy thông qua các mô hình trí tuệ nhân tạo.

DALL-E 2 là thành quả được phát triển của OpenAI - một công ty khởi nghiệp được hỗ trợ bởi gã khổng lồ công nghệ Microsoft.

Trên trang web của mình, OpenAI gọi DALL-E 2 là “một hệ thống AI mới có thể tạo ra hình ảnh và nghệ thuật thực tế từ một mô tả bằng ngôn ngữ tự nhiên”.

Trên thực tế, chỉ một nhóm tương đối nhỏ những người dùng được trải nghiệm việc chia sẻ những hình ảnh được tạo ra từ văn bản vì cho đến thời điểm hiện tại, OpenAI vẫn chưa phát hành hệ thống trên đến với công chúng.

Trong một bài đăng trên trang web của công ty, Joanne Jang của OpenAI cho biết: “Chúng tôi đang làm việc chăm chỉ để tăng tốc độ truy cập, nhưng có thể sẽ mất một khoảng thời gian cho đến khi đến được với tất cả mọi người; kể từ ngày 15 tháng 6, chúng tôi đã mời 10,217 người dùng thử DALL-E”.

Trước đó, một hệ thống đã được công bố rộng rãi có tên là DALL - E Mini, tuy nhiên hệ thống trên thường xuyên bị quá tải do nhu cầu sử dụng quá lớn.

Người dùng thường xuyên được chào đón bằng một hộp thoại với nội dung “Quá nhiều lưu lượng truy cập, vui lòng thử lại”.

Các dịch vụ chuyển văn bản thành hình ảnh rất phức tạp khi phải xác định các phần quan trọng nhất trong văn bản của người dùng sau đó tìm cách để minh họa các thuật ngữ đó.

Google đã đào tạo mô hình Imagen của mình với hàng trăm chip AI nội bộ trên 460 triệu cặp văn bản hình ảnh bên trong, ngoài dữ liệu bên ngoài.

Các giao diện của hệ thống khá đơn giản. Nói chung có một hộp văn bản, một nút để bắt đầu quá trình tạo và một khu vực bên dưới để hiển thị hình ảnh.

Để chỉ ra nguồn, Google và OpenAI thêm hình mờ ở góc dưới cùng bên phải của hình ảnh từ DALL-E 2 và Imagen.

Tuy nhiên, OpenAI nhận ra khả năng gây hại có thể đến từ việc công nghệ này sẽ dễ dàng tạo ra các thông tin sai lệch và khiến mọi người nghi ngờ về tất cả những gì mình thấy trên Internet.

Để giải quyết rủi ro, các nhà phát triển đã xóa nội dung bạo lực khỏi dữ liệu và có các bộ lọc ngăn DALL-E 2 tạo hình ảnh nếu người dùng gửi lời nhắc có thể vi phạm chính sách của công ty về nội dung người lớn, bạo lực, hoặc yếu tố chính trị.

Prafulla Dhariwal, một nhà khoa học nghiên cứu OpenAI cho biết: “Có một quá trình đang diễn ra để cải thiện sự an toàn của các hệ thống này”.

Bất chấp rủi ro, OpenAI rất hào hứng với những thứ mà công nghệ có thể kích hoạt. Dhariwal cho biết công nghệ trên có thể mở ra cơ hội sáng tạo cho các cá nhân và có thể giúp ứng dụng thương mại cho các trang web thiết kế nội thất hoặc trang điểm.

Hiện tại, hệ thống sẽ tiếp tục được cải thiện trong thời gian tới.

AI ngày càng phát triển, có thể biến lời nói thành hình ảnh

CNBC: Ông Trump chỉ còn 2 tuần để giải bài toán eo biển Hormuz

CNBC: Thụy Sĩ phát tín hiệu can thiệp tỷ giá, dễ khiến ông Trump nổi giận

Top 300 Công ty Fintech toàn cầu 2025: Binance dẫn đầu trong nhóm tài sản số

Ông Trump bất ngờ chỉ trích Trung Quốc vì ngừng mua máy bay Boeing

CNBC: 73% nhân viên Amazon cân nhắc nghỉ việc sau lệnh quay trở lại văn phòng 5 ngày/tuần

CNBC

DALL-E

OpenAI

Joanne Jang

Imagen

Google

AI

Người máy của tỷ phú Phạm Nhật Vượng 'đi làm' tại safari Phú Quốc, công việc được đánh giá là đầy thử thách

Tin cực vui với toàn bộ khách hàng đang sử dụng Internet Viettel

Chiếc điện thoại gập giá từ 219 triệu đồng có gì mà gây chú ý giới nhà giàu?

Chuyên gia nói về chuyện 'lắc bình xăng' gây sốt mạng xã hội

Máy lạnh không dùng điện xuất hiện, có thể tạo hơi lạnh 5–15°C và hoạt động nhờ năng lượng Mặt Trời

Một mặt hàng bạo lực, nhạy cảm ‘qua mặt’ kiểm duyệt, dễ dàng tiếp cận trẻ em

Geely Galaxy Cruiser 700 lộ diện: SUV ngàn mã lực phả hơi nóng lên Toyota Land Cruiser

Chỉ vài giờ nữa, KDL 6.000 tỷ lớn bậc nhất Đông Nam Á của vợ chồng bà Nguyễn Phương Hằng sẽ bắt đầu diễn ra chương trình đặc biệt

Việt Nam sắp xây dựng thêm cầu vượt biển dài gần 18km, gấp 3 lần cầu vượt biển dài nhất hiện tại, vốn đầu tư khoảng 19.000 tỷ

Từ hôm nay, toàn bộ cây xăng cả nước chỉ bán xăng E10 và xăng E5 : Người dân cần lưu ý gì khi chuyển đổi?

TTCK có thể điều chỉnh thêm 2 tuần, nhóm cổ phiếu nào đáng chú ý?

Ngành học ra trường là có việc ngay ở bệnh viện, học phí tới 760 triệu đồng, chỉ cần 7,5 điểm/ môn là đỗ

Trung Quốc tặng Campuchia sân vận động gần 4.000 tỷ đồng, sức chứa 60.000 chỗ ngồi

Từ ngày mai, VinBus bắt đầu miễn phí cho hàng khách trên tuyến dài 200km

Hoàng Anh Gia Lai nằm trong danh sách được đề cử gửi Bộ Công Thương, dự kiến nhận trọng trách thúc đẩy kinh tế của cả một vùng

Sơn Hải đưa thêm 22km cao tốc vào hoạt động, tiếp tục tuyên bố sẽ ‘bảo hành 10 năm’

Cầu vượt sông gần 1.000 tỷ nối 2 tỉnh miền Bắc, kết thúc hơn 200 năm di chuyển bằng đò của người dân bên sông Hồng

Chi tiết cách tính lương, phụ cấp mới từ 1/7

Chọn nhà thầu Trung Quốc cho tuyến cao tốc dài 282km nối 2 thành phố lớn, vốn đầu tư hơn 57.000 tỷ đồng

Phát hiện mỏ chứa 104 tấn vàng và 24 tấn bạc tại vùng đất hẻo lánh sau 1 thập kỷ thăm dò

Chính thức khánh thành siêu cầu dây văng một trụ dài nhất thế giới: Xây dựng suốt 30 năm với tổng vốn 400 triệu USD, có thể chịu động đất trên 7 độ