MosaicML phát triển công cụ ngăn chặn hành vi vi phạm bản quyền bằng AI

Naveen Rao, thành viên trong danh sách AI 100 đầu tiên của Insider cho biết, công nghệ AI tạo sinh đang gặp vấn đề nghiêm trọng trong việc kiếm tiền từ chúng.
Rao, người giám sát chiến lược Generative AI cho Databricks sau khi công ty này mua startup MosaicML của ông với giá 1,3 tỷ USD, ví vấn đề này giống như vấn đề đã đè bẹp Napster, nền tảng chia sẻ âm nhạc từ những năm 2000.
Napster, ban đầu cực kỳ nổi tiếng, về cơ bản đã thay đổi cách mọi người thưởng thức và chia sẻ âm nhạc cho đến khi nó bị kiện vì vi phạm bản quyền nhiều lần đến mức phá sản chỉ sau ba năm kể từ khi ra mắt. Công ty đã được mua đi bán lại nhiều lần đến nỗi giờ đây nó chỉ còn là cái bóng của chính nó trước đây. Trong khi đó, Apple ra mắt iTunes và trở thành thế lực thống trị lĩnh vực phát nhạc trực tuyến.

Rao nhận thấy một kịch bản tương tự đang diễn ra với AI tạo sinh, công nghệ mang đến khả năng sáng tạo đáng kinh ngạc chỉ bằng vài dòng chữ. Nhưng điều đó chỉ thực hiện được sau khi sử dụng lượng lớn dữ liệu để đào tạo các mô hình của nó. Việc OpenAI giới thiệu ChatGPT vào năm ngoái đã làm dấy lên làn sóng đào tạo mô hình AI điên cuồng – và rất nhiều mối lo ngại rằng những mô hình đó đang sử dụng tài liệu có bản quyền, tự đào tạo để bắt chước hay thậm chí sử dụng các thành phần sẵn có, khiến người dùng cá nhân dễ dàng xâm phạm bản quyền trí tuệ và các công ty dễ bị kiện hơn.
Những vụ kiện như vậy đã dần bắt đầu. Mới tháng trước, một nhóm gồm 17 tác gia nổi tiếng, bao gồm Jodi Picoult và George R.R. Martin, người sáng tạo ra “Game of Thrones”, đã kiện OpenAI tại tòa án liên bang Hoa Kỳ với cáo buộc “hành vi trộm cắp có hệ thống trên quy mô lớn” vì lo ngại tác phẩm của họ đang được sử dụng để huấn luyện các mô hình Ai. Đối với Rao, vụ kiện này gợi nhớ đến một số vụ kiện đầu tiên chống lại Napster, chẳng hạn như vụ Metallica đệ trình vào năm 2000.
“Chúng cần phải được tôn trọng,” Rao nói về các tài liệu có bản quyền. “Và chúng ta cần các công cụ để làm điều đó.”
Rao đã dành cả sự nghiệp của mình để xây dựng những công cụ đó cho thời điểm này. Là một kỹ sư sở hữu bằng tiến sĩ khoa học thần kinh, Rao đang nghiên cứu các máy biến đổi thần kinh — những máy tính lấy cảm hứng từ bộ não con người — tại Qualcomm. Ông đã bán công ty đầu tiên của mình, startup về deep learning Nervana, cho Intel vào năm 2016 với giá hơn 350 triệu USD.

Với MosaicML, Rao đã xây dựng một nền tảng cung cấp cho các công ty các mô hình căn bản để biến thành mô hình ngôn ngữ lớn (LLM) và đào tạo chúng bằng dữ liệu của riêng họ trong một môi trường an toàn.
Luận điểm của Rao là nếu các công ty có cách sử dụng dữ liệu của chính họ một cách an toàn để đào tạo mô hình trên nền tảng nguồn mở, minh bạch, thì họ sẽ không phải lo lắng về những thách thức pháp lý và có thể kiếm tiền thành công từ các dịch vụ dựa trên AI.
Ngoài các nguồn dữ liệu, Rao nhận thấy một lý do kinh doanh quan trọng khác để các công ty xây dựng LLM của riêng mình: sự khác biệt. Nền tảng của MosaicML cung cấp cơ sở hạ tầng thân thiện với người dùng để các công ty xây dựng mô hình của riêng họ, điều mà Rao cho biết các đối thủ cạnh tranh như OpenAI chưa thể cung cấp.
Rao nói với Insider: “Chúng tôi xây dựng các công cụ cho phép các công ty phân biệt AI của họ với AI của những người khác và tận dụng dữ liệu của họ một cách độc đáo”.
Rao nghĩ về công nghệ của Mosaic như một kiểu dân chủ hóa AI tạo sinh và ông ấy đã mang đặc tính đó đến Databricks – công ty đã tung ra LLM mã nguồn mở của riêng mình có tên Dolly, một công cụ mà các công ty khách hàng cũng có thể sử dụng để giúp đào tạo các mô hình của riêng họ. Rao nói rằng càng có nhiều người xây dựng công nghệ AI tổng quát thì càng tốt.
Rao nói: “Điều thú vị về công nghệ là luôn có một số yếu tố của nó có thể được sử dụng theo những cách bất chính. Và cách để ngăn chặn điều đó là trang bị cho mọi người những công cụ tương tự và khả năng sử dụng chúng một cách hiệu quả.”
Bài: Hiếu Võ – Theo Business Insider
Comments