Baichuan - đối thủ mới của Openai và Anthropic

Baichuan, một cái tên mới nổi trong cộng đồng trí tuệ nhân tạo (AI), đã tuyên bố đánh bại cả OpenAI và Anthropic bằng việc giới thiệu mô hình ngôn ngữ lớn Baichuan2-192k.

Theo công bố mới, mô hình này có khả năng xử lý tới 350.000 ký tự tiếng Trung và nhanh chóng trở thành “ông vua” trong lĩnh vực xử lý các truy vấn văn bản dài.

 

 
Theo Baichuan, Baichuan2-192k là mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài

Công ty Baichuan, một công ty khởi nghiệp về AI có trụ sở tại thủ đô Bắc Kinh, công ty này cũng được thành lập bởi người sáng lập công cụ tìm kiếm Trung Quốc Sogou, ông Wang Xiaochuan, đã công bố phiên bản mới nhất của mô hình Baichuan2-192k vào ngày 31/10/2023. Điều đặc biệt về mô hình này là khả năng tóm tắt tiểu thuyết, mở ra nhiều tiềm năng mới cho việc ứng dụng của AI.

Một điểm mạnh của Baichuan2-192k là “cửa sổ ngữ cảnh” của nó, khả năng kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình tương tác với người dùng. Điều này giúp mô hình không chỉ hiểu rõ hơn mà còn trở nên linh hoạt trong nhiều ngữ cảnh khác nhau.

So với các đối thủ cạnh tranh như: Claude 2 của Anthropic, Baichuan tự tin tuyên bố rằng cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT- 4 của OpenAI. Thêm vào đó, mô hình này được chứng minh vượt trội về chất lượng phản hồi, hiểu biết, và khả năng tóm tắt văn bản dài, theo kết quả kiểm tra từ dự án LongEval của Đại học California.

Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng. Để so sánh, Claude 2, được Anthropic do Amazon.com hậu thuẫn giới thiệu vào tháng 7/2023, là mô hình AI tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho là có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Trong khi mô hình ngôn ngữ lớn Baichuan2-192k (LLM), phiên bản mới nhất, có “cửa sổ ngữ cảnh” của nó có thể xử lý khoảng 350.000 ký tự tiếng Trung. Theo bài đăng trên WeChat của công ty Trung Quốc, cửa sổ ngữ cảnh của mô hình Baichuan lớn hơn 14 lần so với GPT-4-32k của OpenAI.

 

 
Người sáng lập Baichuan Wang Xiaochuan. Ảnh: Weibo

Baichuan không chỉ dừng lại ở việc công bố, mà còn đưa ra cam kết thực hiện thử nghiệm nội bộ với Baichuan2-192k cùng với các đối tác công nghiệp. Công ty đặt mục tiêu tạo ra một công cụ hữu ích cho doanh nghiệp cần xử lý và tạo ra văn bản dài hàng ngày, đặc biệt là trong các lĩnh vực như pháp lý, truyền thông, và tài chính.

Tuy nhiên, theo nghiên cứu từ các học giả tại Đại học Stanford và Đại học California (Berkeley), khả năng xử lý nhiều thông tin không nhất thiết làm cho một mô hình ngôn ngữ lớn trở nên xuất sắc hơn so với các đối thủ khác. Điều này đặt ra những thách thức cho Baichuan và các đối thủ trong cuộc đua ngày càng khốc liệt trong thế giới AI đang phát triển nhanh chóng.

Ngoài ra, Baichuan đối mặt với sự cạnh tranh ngày càng cao từ các đối thủ Trung Quốc khác như: Alibaba Cloud, Zhipu AI, iFlytek và Baidu, đang nỗ lực để thu hút người dùng với các mô hình và ứng dụng AI mạnh mẽ của họ. Điều này chỉ là một phần trong cuộc đua toàn cầu để tạo ra những tiến bộ mới trong lĩnh vực AI và mô hình ngôn ngữ lớn.

P.A.T tổng hợp từ https://www.scmp.com/; https://www.cnbc.com/ ngày 01/12/2023

sưu tầm
Sử dụng công nghệ sàn giao dịch Techport
Scroll