AI mã nguồn mở nghe có vẻ như một cánh cửa rộng mở.
Các nhà phát triển có thể lấy mã cho các mô hình như Llama của Meta, Stable Diffusion của Stability AI, hoặc bất cứ thứ gì từ Mistral, và bắt đầu xây dựng.
Các công cụ này miễn phí để tải xuống và sử dụng.
Ý tưởng là cung cấp cho mọi người – từ lập trình viên cá nhân đến các nhóm nhỏ – những công cụ giống như các công ty lớn có.
Nhưng mọi thứ không đơn giản như vậy.
Nội dung chính
Phần cứng không miễn phí
Như đã đề cập chi tiết trong một bài viết trênSubstack, Tiến sĩ Saffron Huang từ Đại học Cambridge sử dụng Stable Diffusion cho nghiên cứu thị giác máy tính của mình với một hệ thống tùy chỉnh gồm tám GPU NVIDIA RTX 4090, với chi phí hơn 20.000 bảng Anh.
“Có một sự trớ trêu sâu sắc ở đây,” cô nói.
“Mã nguồn có sẵn miễn phí, nhưng tài nguyên tính toán cần thiết để đào tạo, tinh chỉnh hoặc đôi khi chỉ để chạy các mô hình này tạo ra một tầng lớp quý tộc công nghệ mới.”
Khoảng cách càng lớn hơn khi đào tạo các mô hình lớn.
Llama 3 của Meta, với 70 tỷ tham số, cần hàng nghìn GPU chạy liên tục trong nhiều tháng ở giai đoạn đào tạo.
Chỉ riêng hóa đơn điện năng đó đã có thể phá hủy một doanh nghiệp nhỏ.
Chắc chắn các nhà nghiên cứu độc lập không có cơ hội?
“Chúng ta đang chứng kiến sự phân chia trong cộng đồng AI,” Tiến sĩ Jakob Uszkoreit, đồng sáng lập Inceptive, nói.
“Một bên là các tổ chức có quyền truy cập vào nguồn tài nguyên tính toán khổng lồ có thể tiến xa hơn;
bên kia là tất cả những người khác phải điều chỉnh các mô hình đã được đào tạo trước trong điều kiện tính toán hạn chế.”
Chi phí môi trường càng làm vấn đề thêm trầm trọng.
Một mô hình lớn có thể tạo ra lượng carbon bằng năm chiếc xe hơi trong suốt vòng đời của chúng.
Nhu cầu về tính toán tạo ra một loại rào cản mới, ảnh hưởng nặng nề nhất đến các khu vực nghèo hơn và dễ bị tổn thương bởi khí hậu.
Không công bằng trên toàn cầu
Vấn đề phần cứng trở nên rõ ràng nhất khi xét trên phương diện địa lý.
Ở các nước Nam Bán cầu, việc tiếp cận GPU mạnh và internet nhanh, ổn định bị hạn chế.
Khoảng cách đó khiến Tiến sĩ Timnit Gebru gọi xu hướng này là “chủ nghĩa thực dân thuật toán.”
Tại Nigeria, kỹ sư phần mềm Chioma Onyekwere thường xuyên gặp tình trạng mất điện khi cố gắng xây dựng một công cụ chẩn đoán với AI mã nguồn mở.
“Tôi không thể không nhận thấy sự trớ trêu,” cô nói.
“Về lý thuyết, các công nghệ này có thể mang lại lợi ích lớn nhất cho các cộng đồng thiếu thốn, nhưng chúng tôi lại phải đối mặt với những rào cản không thể vượt qua khi triển khai.”
Chỉ 40% người dân ở Châu Phi có internet ổn định, theo dữ liệu của ITU.
Và còn ít người hơn có thể tải xuống và chạy các mô hình AI lớn.
Khai thác tiền mã hóa và các vấn đề chuỗi cung ứng khiến GPU càng khó kiếm hơn.
Các nhà cung cấp đám mây như AWS và Google Cloud đã thêm nhiều trung tâm dữ liệu hơn, nhưng nhiều khu vực gặp vấn đề về độ trễ khiến AI thời gian thực là không thể.
“Đó là một dạng phân biệt kỹ thuật số,” Tiến sĩ Rumman Chowdhury nói.
“AI mã nguồn mở đã vô tình tạo ra một hệ thống truy cập hai tầng, củng cố thêm sự bất bình đẳng toàn cầu hiện có.”
Kỹ năng cũng là một rào cản
Ngay cả với internet và phần cứng, vẫn có yêu cầu đáng kể về kiến thức kỹ thuật chuyên môn.
Nhiều mô hình mở yêu cầu hiểu biết về học máy và lập trình.
Hugging Face và các công cụ khác có thể giúp ích, nhưng rào cản gia nhập vẫn cao.
“Áp lực nhận thức khi làm việc với các mô hình này là rất lớn,” Tiến sĩ Charles Sutton từ Đại học Edinburgh nói.
“Ngay cả với giao diện đơn giản hóa, bạn vẫn phải đối mặt với tối ưu siêu tham số phức tạp, động lực đào tạo và quyết định kiến trúc mô hình đòi hỏi nhiều năm giáo dục chuyên sâu.”
Hầu hết những người đóng góp cho các dự án AI mã nguồn mở đều có bằng cấp cao, theo GitHub. “Chúng ta phải thừa nhận rằng ‘mở’ không tự động có nghĩa là ‘dễ tiếp cận’,” Tiến sĩ Juliana Peña của Quỹ Mozilla nói.
“Khi việc tiếp cận đòi hỏi kiến thức toán học nâng cao hoặc kỹ năng lập trình, chúng ta vẫn duy trì sự độc quyền – chỉ bằng những cách khác nhau.”
Có những khóa học miễn phí trực tuyến, nhưng hầu hết đều mong đợi người dùng đã biết cách lập trình, và tất nhiên, truy cập chúng đòi hỏi kết nối internet ổn định.
Cách tiếp cận chia sẻ phần cứng
Để giải quyết vấn đề phần cứng, một số nhóm đã tạo ra các thiết lập tính toán chia sẻ như ở Berlin, nơi EleutherCollective vận hành một cụm GPU mà nghệ sĩ và nhà nghiên cứu có thể sử dụng.
“Chúng tôi đang cố gắng tưởng tượng lại mối quan hệ giữa cộng đồng và sức mạnh tính toán,” Frieda Schmidt, một trong những người sáng lập, nói.
“Thay vì từng cá nhân vật lộn để mua phần cứng đắt đỏ, chúng tôi gộp tài nguyên và phân bổ chúng một cách dân chủ.”
Các ví dụ khác bao gồm SuperComputing Commons ở Barcelona và Dự án Dân chủ Tính toán ở Seoul, những thiết lập tập trung vào các dự án có tác động xã hội tích cực.
“Hợp tác xã tính toán đại diện cho con đường trung gian giữa sự độc quyền do thị trường điều khiển và cơ sở hạ tầng hoàn toàn do nhà nước kiểm soát,” nhà kinh tế học Tiến sĩ Kate Raworth nói.
“Chúng thể hiện cách tiếp cận dựa trên cộng đồng có thể định hướng lại công nghệ vì lợi ích công cộng thực sự.”
Các dự án như vậy thường gặp khó khăn với việc bảo trì, hóa đơn điện tăng và phần cứng lỗi thời.
Nếu không có nguồn tài chính thường xuyên và hỗ trợ kỹ thuật, tương lai của chúng vẫn bấp bênh.
Chạy AI mà không sở hữu nó
Một con đường khác để dễ dàng tiếp cận AI là suy luận mở.
Các công ty như Together.ai và Hugging Face cho phép nhà phát triển chạy mô hình từ xa thông qua API.
“Chúng tôi tách biệt quyền sở hữu mô hình khỏi tiện ích mô hình,” CEO Hugging Face Clément Delangue nói.
“Giờ đây, bất kỳ ai có kết nối internet đều có thể sử dụng AI tiên tiến thông qua các lệnh API đơn giản, bất kể hạn chế phần cứng của họ.”
Hugging Face đã giúp các nhà phát triển ở khu vực tài nguyên thấp triển khai công cụ dịch thuật ở Mông Cổ và ứng dụng hỗ trợ nông nghiệp ở Ấn Độ.
Nhưng sự giúp đỡ như vậy có giới hạn, với API thường có giới hạn sử dụng, và vấn đề kết nối internet kém vẫn là rào cản truy cập.
Thêm vào đó, có vấn đề phụ thuộc vào các dịch vụ bên ngoài tạo ra sự lệ thuộc.
“Chúng ta phải hỏi liệu truy cập API có thực sự tạo ra dân chủ hóa hay không,” Tiến sĩ Nathan Schneider từ Đại học Colorado Boulder nói.
“Chúng ta đang tạo ra sự tiếp cận công bằng hơn hay chỉ đơn giản là chuyển từ phụ thuộc phần cứng sang phụ thuộc dịch vụ?”
Chính phủ tham gia
Một số chính phủ đã cố gắng giúp đỡ, với EU đầu tư 2,5 tỷ euro vào cơ sở hạ tầng tính toán cho AI mã nguồn mở, và kế hoạch AI quốc gia của Canada tài trợ tính toán công cộng tại các tổ chức lớn.
Nhưng các nhóm nhỏ thường không đủ điều kiện, đơn đăng ký yêu cầu giấy tờ và chứng chỉ mà nhiều nhà phát triển không có.
“Cơ sở hạ tầng tính toán công cộng nên được coi là thiết yếu như thư viện công cộng,” Tiến sĩ Yoshua Bengio nói.
“Chúng ta cần một sự thay đổi cơ bản trong cách chúng ta hình dung về việc tiếp cận tài nguyên tính toán trong thế kỷ 21.”
Ở những nơi khác, một số quốc gia đã thử các kế hoạch khác nhau, như Phần Lan đảm bảo thời gian tính toán cho các dự án gắn liền với mục tiêu phát triển của Liên Hợp Quốc, và Uruguay thêm công cụ AI vào chương trình giảng dạy trường học.
Nhưng cả hai kế hoạch đều tập trung ít hơn vào việc người dùng là ai và nhiều hơn vào những gì họ đang cố gắng đạt được.
Các công ty vẫn nắm quyền kiểm soát
Khi các công ty phát hành các mô hình mã nguồn mở, họ đang thực hiện những bước đi tích cực hướng tới dân chủ hóa AI, nhưng điều đó không có nghĩa là các mô hình này dễ sử dụng hoặc dễ tiếp cận.
Bản phát hành công khai Llama 2 của Meta có ít hạn chế hơn so với các phiên bản trước, nhưng người dùng vẫn cần phần cứng đắt tiền để chạy mô hình hiệu quả.
Nó cũng đi kèm với giấy phép hạn chế cho mục đích thương mại.
“Có một phổ cởi mở thường bị bỏ qua trong các cuộc thảo luận công khai,” Tiến sĩ James Grimmelmann nói.
“Sự khác biệt giữa giấy phép Llama của Meta và các giấy phép như Apache 2.0 hoặc GPL là rất lớn, với những ảnh hưởng đến việc ai có thể xây dựng ý nghĩa trên các công nghệ này.”
“Có một cách hiểu hoài nghi về AI mã nguồn mở của các công ty,” Tiến sĩ Meredith Whittaker nói.
“Bằng cách phát hành các mô hình mà không đảm bảo khả năng tiếp cận rộng rãi đến các tài nguyên máy tính cần thiết, các công ty hưởng lợi từ danh tiếng cởi mở trong khi duy trì sự độc quyềnde factothông qua các hạn chế giấy phép và rào cản máy tính.”
Một số công ty cung cấp hỗ trợ như NVIDIA cung cấp tài trợ GPU, Google cung cấp tín dụng đám mây miễn phí, và Stability AI hỗ trợ các hợp tác xã máy tính ở Đông Nam Á và Châu Phi.
“Chúng tôi nhận ra rằng việc phát hành các mô hình mở chỉ là một nửa của vấn đề,” Emad Mostaque, CEO của Stability AI nói.
“Nếu không giải quyết khoảng cách máy tính, mã nguồn mở vẫn chỉ là một lời hứa suông với phần lớn thế giới.”
Các mô hình nhỏ hơn, thiết kế thông minh hơn
Một số nhà nghiên cứu tập trung vào việc xây dựng các mô hình nhỏ hơn, hiệu quả hơn.
Tiến sĩ Laura Montoya tại UCL (Đại học College London) gọi đây là ‘AI tiết kiệm.’ “Chúng tôi đang thách thức giả định rằng lớn hơn luôn tốt hơn,” cô nói.
“Thông qua thiết kế kiến trúc cẩn thận và chưng cất kiến thức, chúng tôi có thể tạo ra các mô hình chạy trên một phần nhỏ tài nguyên máy tính trong khi vẫn giữ được hầu hết các khả năng.”
Các công cụ như lượng tử hóa, cắt tỉa, và chưng cất giúp thu nhỏ mô hình nhưng vẫn giữ hiệu suất cao:
Mistral 7B và Phi-2 của Microsoft chạy tốt trên các hệ thống cấp thấp, ví dụ.
“Tương lai của AI dễ tiếp cận không chỉ nằm ở việc phân phối máy tính công bằng hơn, mà còn ở việc suy nghĩ lại cơ bản cách tiếp cận thiết kế mô hình,” Tiến sĩ Yann LeCun nói.
“Chúng ta cần lấy cảm hứng từ nhận thức con người, đạt được khả năng đáng kinh ngạc với yêu cầu năng lượng tương đối khiêm tốn.”
Dữ liệu vẫn là nút thắt
Các mô hình có thể mở và dễ dàng có sẵn, nhưng việc tiếp cận dữ liệu huấn luyện cần thiết thường không dễ dàng.
“Chúng ta đã tạo ra một tình huống mà các mô hình thì mở nhưng dữ liệu cần thiết để làm chúng hữu ích thường không mở,” Tiến sĩ Margaret Mitchell nói.
“Điều này tạo ra một lớp loại trừ khác ảnh hưởng không cân xứng đến các cộng đồng thiệt thòi.”
Hầu hết dữ liệu huấn luyện bằng tiếng Anh hoặc phản ánh quan điểm phương Tây.
Dữ liệu chất lượng cao tốn tiền và thời gian để thu thập, với nhiều tổ chức khó có thể chi trả.
Một số nguồn dữ liệu huấn luyện có sẵn dưới giấy phép mã nguồn mở, đặc biệt từ các tổ chức độc lập với các công ty AI lớn.
Common Voice của Mozilla và các dự án Masakhane đã giúp đỡ bằng cách thu thập dữ liệu giọng nói và tài nguyên ngôn ngữ từ cộng đồng.
“Các kho dữ liệu chung đại diện cho một bổ sung quan trọng cho các mô hình mã nguồn mở,” Tiến sĩ Rada Mihalcea nói.
“Bằng cách tạo ra các kho lưu trữ được quản lý tập thể của dữ liệu đa dạng, có nguồn gốc đạo đức, chúng ta có thể bắt đầu giải quyết mặt đầu vào của phương trình tiếp cận.”
Làm cho ‘mở’ thực sự mở
Khắc phục khoảng cách trong AI mã nguồn mở sẽ cần nỗ lực trên nhiều mặt.
Các mô hình cần hiệu quả hơn, chính sách cần coi máy tính như cơ sở hạ tầng công cộng, các nhóm GPU chia sẻ cần hỗ trợ ổn định, và các công ty nên vượt ra ngoài việc phát hành mô hình và giúp xây dựng khả năng tiếp cận.
“Dân chủ hóa AI không phải là một thách thức kỹ thuật mà là một thách thức xã hội-chính trị,” Tiến sĩ Kate Crawford nói.
“Nó yêu cầu chúng ta tưởng tượng lại mối quan hệ với công nghệ, thách thức các giả định về quyền sở hữu, tiếp cận và quản trị.”
Giáo dục cũng quan trọng.
Nhiều người cần học cách sử dụng các công cụ này và điều đó có nghĩa là xây dựng các con đường học tập bên ngoài trường học truyền thống.
“Chúng ta đang ở một điểm uốn trong sự phát triển của AI,” Tiến sĩ Deb Raji nói.
“Những quyết định chúng ta đưa ra bây giờ về khả năng tiếp cận và cơ sở hạ tầng sẽ quyết định liệu AI mã nguồn mở có thực hiện được tiềm năng dân chủ hóa hay chỉ tái tạo các động lực quyền lực hiện có dưới hình thức mới.”
AI mã nguồn mở sẽ không thực sự mở cho đến khi nhiều người có thể sử dụng nó.
Với sự kết hợp đúng đắn của thay đổi kỹ thuật, hỗ trợ cộng đồng và chính sách công, tương lai đó vẫn trong tầm tay.
(Ảnh bởiShahadat Rahman)
Xem thêm:
Tại sao ngôn ngữ lập trình Ada 40 tuổi lại hot trở lại?

Tags:ai , coding , developer , featured , open source , software development