Giới thiệu PhởGPT: Phiên bản ChatGPT cho người Việt

Giúp NTDVN sửa lỗi

PhởGPT là một dự án mã nguồn mở do VinAI phát triển, được mệnh danh là ChatGPT cho người Việt, tất cả các bên đều có thể sử dụng.

PhởGPT là của ai?

Tại sự kiện Ngày trí tuệ nhân tạo Việt Nam (AI Day) với chủ đề “AI – tái thiết thực tại”, được tổ chức tại TP.HCM vào ngày 5/12, Công ty VinAI đã lần đầu tiên chính thức công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ “PhởGPT”. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho người Việt và văn hoá Việt.

Tiến sĩ Bùi Hải Hưng, Tổng Giám đốc VinAI cho biết PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

So sánh PhởGPT và ChatGPT

Theo các chuyên gia, so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy, PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá.

Theo ông Hưng, PhởGPT được công ty phát triển từ đầu, độc lập với hầu hết tất cả mô hình khác trên thế giới; bởi vì mô hình được phát triển bằng mã nguồn mở nên mọi người đều có thể sử dụng và tiếp tục cải thiện nó tốt hơn.

Toàn cảnh sự kiện AI Day.

Điều này sẽ giúp cộng đồng mã nguồn mở của người Việt Nam ngày càng cải thiện chất lượng cho mô hình ngôn ngữ lớn tiếng Việt, tạo ra một hiệu ứng rất tốt để nhiều công ty khác nhau có thể tham gia và ứng dụng vào một mảng nào đấy.

Như vậy, dự án này có 2 điểm khác biệt:

  1. Thay vì lấy một mô hình ngôn ngữ lớn có sẵn, tinh chỉnh lại và biến nó thành của mình, VinAI đã tự xây dựng PhởGPT từ đầu. Do vậy, đội ngũ nghiên cứu của VinAI có thể dùng nhiều cách khác nhau để tối ưu mô hình này cho ngôn ngữ tiếng Việt.
    Những kỹ thuật mới không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.
  2. Điểm đặc biệt thứ hai của PhởGPT là một dự án mã nguồn mở - khác với mô hình mã nguồn đóng như GPT-4 (mô hình nền tảng cho ChatGPT). Việc công khai mã nguồn PhởGPT và sẵn sàng cung cấp cho mọi người, giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.

Tương lai thế nào?

Tiến sĩ Bùi Hải Hưng cho biết, các mô hình ngôn ngữ lớn AI đòi hỏi rất lớn về năng lực cũng như nền tảng tính toán lớn và rất tốn kém về chi phí. Vậy nên VinAI đang cố gắng tối ưu hoá những mô hình ngôn ngữ lớn như thế này, để tạo ra những mô hình có độ chính xác và nhỏ gọn hơn, có thể chạy được trên các nền tảng tính toán cũng nhỏ hơn, giúp giảm giá thành.

Trong thời gian qua, việc phát triển công nghệ AI ở Việt Nam là khá nhanh. Việc VinAI nghiên cứu và phát triển, công bố PhởGPT, sẽ đặt những nền móng đầu tiên cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao.

Trong thời gian tới, công ty sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như Y tế, Giáo dục…

Xem thêm:



BÀI CHỌN LỌC

Giới thiệu PhởGPT: Phiên bản ChatGPT cho người Việt