OpenAI ra mắt mô hình nguồn mở giá rẻ, cạnh tranh DeepSeek

Date: Category:Công nghệ Views:1 Comment:0


Hai mô hình chỉ xử lý văn bản này có tên gpt-oss-120b và gpt-oss-20b. Theo OpenAI, chúng được thiết kế như những lựa chọn có chi phí thấp hơn, giúp các nhà phát triển, nhà nghiên cứu và các công ty dễ dàng chạy và tùy chỉnh.

Một mô hình trí tuệ nhân tạo được coi là "nguồn mở" (open-weight) nếu các tham số của nó – những yếu tố giúp cải thiện đầu ra và dự đoán trong quá trình đào tạo – được công khai.

Các mô hình nguồn mở mang lại sự minh bạch và khả năng kiểm soát, nhưng chúng khác với các mô hình "mã nguồn mở hoàn toàn" (open-source), vốn cho phép mọi người sử dụng và chỉnh sửa toàn bộ mã nguồn.

deepseek the verge
Mô hình nguồn mở giá rẻ mới của OpenAI sẽ cạnh tranh với các hãng như DeepSeek. Ảnh: The Verge

Trong những năm gần đây, một số công ty công nghệ khác, bao gồm Meta, Mistral AI và startup DeepSeek của Trung Quốc, cũng đã phát hành các mô hình nguồn mở.

Công ty cũng đã hợp tác với các đối tác phần cứng lớn như Nvidia, Advanced Micro Devices (AMD), Cerebras và Groq để đảm bảo các mô hình này hoạt động tốt trên nhiều loại chip khác nhau. 

Việc phát hành các mô hình nguồn mở của OpenAI được cộng đồng công nghệ mong đợi từ lâu, một phần vì công ty đã nhiều lần trì hoãn việc ra mắt.

Trong một bài đăng trên X vào tháng 7, CEO OpenAI Sam Altman cho biết công ty cần thêm thời gian để "tiến hành các bài kiểm tra an toàn bổ sung và xem xét các lĩnh vực có rủi ro cao". 

OpenAI cho biết họ đã thực hiện quá trình đào tạo và kiểm tra an toàn mở rộng trên các mô hình nguồn mở của mình. Công ty đã lọc bỏ các dữ liệu độc hại liên quan đến hóa học, sinh học, phóng xạ và hạt nhân trong giai đoạn pre-training.

Đồng thời, họ cũng mô phỏng cách các đối tượng xấu có thể cố gắng tinh chỉnh các mô hình cho mục đích độc hại.

Thông qua quá trình thử nghiệm này, OpenAI cho biết họ đã xác định các mô hình được tinh chỉnh một cách độc hại không thể đạt được ngưỡng "khả năng cao" trong Preparedness Framework – phương pháp đo lường và chống lại các mối nguy hại.

Công ty cũng đã làm việc với ba nhóm chuyên gia độc lập để đưa ra phản hồi về đánh giá tinh chỉnh độc hại của họ.

OpenAI cho biết người dùng có thể tải xuống các mô hình gpt-oss-120b và gpt-oss-20b trên các nền tảng như Hugging Face và GitHub với giấy phép Apache 2.0.

Các mô hình này sẽ có sẵn để chạy trên máy tính cá nhân thông qua các chương trình như LM Studio và Ollama. Các nhà cung cấp dịch vụ đám mây lớn như Amazon, Baseten và Microsoft cũng đang tích hợp chúng.

Cả hai mô hình đều có khả năng xử lý các tác vụ suy luận nâng cao, sử dụng công cụ và xử lý chain of thought. Chúng được thiết kế để hoạt động ở mọi nơi – từ phần cứng cá nhân đến đám mây và các ứng dụng trên thiết bị.

OpenAI cho biết, người dùng có thể chạy gpt-oss-20b trên một chiếc laptop và sử dụng nó như một trợ lý cá nhân để tìm kiếm tệp tin và viết.

(Theo CNBC)

AI thay thế hàng nghìn việc làm mỗi thángMỸ - Trí tuệ nhân tạo (AI) hiện đang thay thế hàng nghìn việc làm mỗi tháng, trong bối cảnh thị trường lao động đối mặt với nhiều khó khăn do bất ổn thương mại toàn cầu.

Comments

I want to comment

◎Welcome to participate in the discussion, please express your views and exchange your opinions here.