Theo OpenAI
Sora được xây dựng dựa trên những nghiên cứu trước đây về AI tạo ảnh Dall-E và tạo văn bản ChatGPT. Tuy nhiên, tiến sĩ Jim Fan, nhà nghiên cứu cấp cao về AI tại Nvidia, nhận định: “Nếu bạn vẫn cho rằng Sora chỉ là món đồ chơi sáng tạo như Dall-E, hãy nghĩ lại. Nó là mô hình vật lý học hệ thống dựa trên dữ liệu, có thể mô phỏng cả thế giới thực lẫn ảo”.
Điểm yếu của Sora
Theo Medium, tổng hợp văn bản thành video là nhiệm vụ thách thức vì đòi hỏi AI phải hiểu ý nghĩa và ngữ cảnh của văn bản cũng như các khía cạnh khác của hình ảnh, video và chuyển động vật lý. Một trong những lý do OpenAI giới hạn Sora cho một nhóm nhỏ dùng thử là vì nó vẫn còn một số nhược điểm.
“Sora có thể gặp khó khăn khi mô phỏng chính xác tính chất vật lý của một cảnh phức tạp. Nó có thể không hiểu đúng về các mệnh đề mang tính nguyên nhân – kết quả”, OpenAI thừa nhận.
Công ty ví dụ Sora có thể sáng tạo video một người cắn bánh quy nhưng sau đó chiếc bánh còn nguyên và không có vết cắn. Nó cũng có thể nhầm lẫn các chi tiết trái phải, trước sau, ví dụ hình ảnh người đàn ông chạy ngược trên máy tập.
Đột phá của OpenAI
OpenAI chưa công khai mô hình tạo video từ văn bản của mình với công chúng. Trong phần mô tả, công ty cũng đề cập rất ít về công nghệ phía sau và nguồn dữ liệu dùng để đào tạo.
“Sora sử dụng mô hình khuếch tán, tạo video bằng cách bắt đầu với một video nhiễu, độ phân giải thấp sau đó loại bỏ nhiễu qua nhiều bước cho đến khi đầu ra đạt kết quả ưng ý”, công ty đứng sau ChatGPT nói về cách thức hoạt động của Sora. Nhờ vậy, AI này có khả năng tạo toàn bộ video cùng lúc thay vì từng đoạn ngắn và ghép lại như các công cụ khác. Thuật toán cho phép mô hình dự đoán nhiều khung hình cùng lúc để đảm bảo chủ thể giữ nguyên vẹn trong khi các chi tiết khác được tái hiện.
Tuy nhiên, theo các nhà phân tích, điểm gây lo ngại lớn nhất của Sora nằm ở chính đột phá của OpenAI. Những video được tạo ra quá giống thật khiến nhiều người sợ mô hình có thể bị lạm dụng để phát tán nội dung sai lệch, vi phạm quyền riêng tư, phân biệt chủng tộc, thậm chí có thể tác động đến kết quả của các cuộc bầu cử. Dù cấm sử dụng Sora tạo nội dung xấu, công ty hiện chưa tìm được cách nhận biết đâu là hình ảnh do AI tạo ra, đâu là thật để gắn nhãn và phân loại.
Fred Havemeyer, người đứng đầu bộ phận nghiên cứu về AI của Macquarie, cho rằng khả năng đáng kinh ngạc của Sora sẽ gây ra nhiều lo lắng liên quan đến vấn đề đạo đức và ảnh hưởng tới xã hội. Theo ông, tác động tiêu cực của AI sẽ là chủ đề được tranh luận nhiều nhất trong 2024 và Sora là phát súng mở màn.
Còn theo New York Times, OpenAI vẫn giấu kỹ thông tin về những nội dung sử dụng để đào tạo Sora đến từ đâu, bao nhiêu phần trăm trong số đó có bản quyền. “Có thể họ muốn giữ bí mật để duy trì lợi thế cạnh tranh, nhưng cũng có thể họ sợ bị kiện liên quan đến bản quyền, tương tự rắc rối ChatGPT đang đối mặt”, trang này viết.
Tuy nhiên, giới phân tích đều chung nhận định Sora đang mở ra một kỷ nguyên mới của AI tạo video, tương tự cách ChatGPT xuất hiện. Khi chính thức thương mại hóa, nó có thể tác động trực tiếp đến ngành điện ảnh, truyền thông và thiết kế game.
Reece Hayden, nhà phân tích cấp cao tại ABI Research, nói trên CBS News rằng trong tương lai, những AI như Sora thậm chí sẽ thay đổi mô hình hoạt động của các nền tảng như Netflix khi người dùng có thể sửa đoạn kết câu chuyện hoặc tự tạo bộ phim theo ý mình chỉ với những dòng văn bản.
Tạo tài khoản tại đây :
Nguồn + vnexpress
Pingback: Câu chuyện về Hành "trìng" kiếm tiền với tiktok của mình - SimCode.Pro