ChatGPT là gì? Tất cả thông tin quan trọng cần biết về ChatGPT

Giúp NTDVN sửa lỗi

Vào những ngày cuối năm 2022, ChatGPT đã tạo ra khá nhiều bất ngờ cho cộng đồng công nghệ. Bài viết này giới thiệu ChatGPT là gì? Và tất cả thông tin quan trọng cần biết về ChatGPT.

ChatGPT là gì?

ChatGPT là một chatbot được tạo ra bởi tổ chức OpenAI. ChatGPT có khả năng trả lời hay phản hồi lại với bất kỳ nội dung nào nhập vào từ người dùng. Tuỳ theo nội dung bạn nhập vào, mà ChatGPT sẽ có những đoạn trả lời tương ứng.

Ví dụ nếu bạn nhập vào 1 đoạn dữ liệu ‘random' (ngẫu nhiên), không có ý nghĩa, thì câu trả lời bạn nhận được sẽ là: “Tôi xin lỗi, nhưng có vẻ như bạn chỉ đang gõ các chữ cái ngẫu nhiên. Có bất cứ điều gì cụ thể mà bạn muốn biết hoặc nói về? Tôi sẽ cố gắng hết sức để giúp bạn giải đáp mọi thắc mắc.”

Khi bạn truy cập vào trang web chính thức của OpenAI và ChatGPT thì bạn sẽ bắt gặp đoạn giới thiệu này: “ChatGPT: Optimizing Language Models for Dialogue”; điều này có nghĩa là ChatGPT được tạo ra bằng cách tối ưu các mô hình ngôn ngữ, nhưng có mục tiêu rõ ràng là dành cho đối thoại (dialogue).

Hình ảnh giới thiệu ChatGPT. (Ảnh chụp màn hình từ trang web chính thức của ChatGPT, openai.com)
Hình ảnh giới thiệu ChatGPT. (Ảnh chụp màn hình từ trang web chính thức của ChatGPT, openai.com)

Để biết thêm chi tiết về việc ChatGPT được tạo ra như thế nào? Và các cơ sở kiến thức của ChatGPT là gì? Cũng như mô hình ngôn ngữ là gì? Bạn xem thêm ở các phần bên dưới.

Cách tạo tài khoản ChatGPT

Để tạo tài khoản ChatGPT, bạn vào trang web Login của ChatGPT với đường dẫn sau đây: https://chat.openai.com/auth/login.

Sau đó, bạn thực hiện các bước sau:

Bước 1: Bấm vào Sign up (có nghĩa là đăng ký), nếu bạn chưa có tài khoản.

Bước 2: Điền vào email của bạn ở ô ‘Email address' hoặc chọn ‘Continue with Google' (có nghĩa là bạn sẽ sử dụng tài khoản Email hiện đang đăng nhập trên Google để đăng ký tài khoản cho ChatGPT). Ví dụ ở đây mình chọn ‘Continue with Google'.

ChatGPT là gì? Tất cả thông tin quan trọng cần biết về ChatGPT

Bước 3: Một giao diện ‘Sign in with Google’ hiện ra, lúc này bạn chọn vào tài khoản Email của bạn.

Bước 4: Điền vào số điện thoại và bấm vào ‘Send code'. Sau đó, ứng dụng ChatGPT sẽ gửi một mã xác nhận gồm 6 số vào số điện thoại của bạn. Bạn tiến hành điền mã xác nhận này vào giao diện hiện ra.

Nếu bạn tạo tài khoản ChatGPT thành công, thì màn hình chat hiện ra như hình sau:

Cách tạo tài khoản ChatGPT ở Việt Nam

Trong trường hợp, nếu bạn ở Việt Nam và không thể truy cập vào đường link của trang GPT, bạn có thể sử dụng VPN để chuyển địa chỉ IP của bạn sang một địa chỉ IP ở những nước có thể truy cập vào trang web của ChatGPT, ví dụ như Mỹ hay Nhật.

Sau đây là 1 bài viết giới thiệu về 7 nhà cung cấp VPN miễn phí hàng đầu năm 2023.

Sau khi chuyển địa chỉ IP thành công, bạn làm theo các bước bên trên để tạo tài khoản ChatGPT.

ChatGPT cần số điện thoại để xác nhận, trong trường hợp này, bạn có thể sử dụng công cụ smspool.net để sử dụng tạm thời một số điện thoại để lấy mã xác nhận.

Cách sử dụng ChatGPT

ChatGPT có thể được xem như là một chatbot, nên bạn có thể hỏi ChatGPT bất kỳ câu hỏi nào. Vì ChatGPT chưa được huấn luyện để trả lời các câu hỏi về tin tức, nên khi bạn hỏi về vấn đề tin tức, thì ChatGPT có thể sẽ không trả lời được.

Sau đây là một số khả năng ấn tượng mà ChatGPT làm được:

  • Viết chương trình theo yêu cầu
  • Tìm lỗi trong chương trình và hướng dẫn cách sửa lỗi
  • Phát hiện lỗ hổng bảo mật
  • ChatGPT của OpenAI sáng táng thơ
  • ChatGPT của OpenAI vượt qua khả năng của Google

Đối với những tính năng này, bạn có thể xem chi tiết ở đây: ChatGPT của OpenAI có thể làm được những việc gì?

Ngoài ra, ChatGPT có thể đóng vai trò như là một Chatbot về y tế. Một người dùng Twitter có tên tài khoản là ‘Roxana Daneshjou MD/PhD’ đã đăng một dòng tweet như sau:

“Tôi đang thử nghiệm các kịch bản chăm sóc sức khỏe trên chatbot mới của OpenAI và cho đến nay tôi rất ấn tượng. Có vẻ như chatbot này có thể có tiềm năng như một chatbot y tế, nhưng rõ ràng là cần phải kiểm tra những thành kiến và thông tin sai lệch.”

ChatGPT có được dùng miễn phí không?

Hiện tại ChatGPT đang được mở miễn phí cho người dùng. Có thể đây là giai đoạn để hệ thống kiểm tra và sửa lỗi. Có thể sau này, ChatGPT sẽ có thu phí.

Hạn chế của ChatGPT là gì?

Chưa được huấn luyện về mảng tin tức

Nếu bạn hỏi ChatGPT các câu hỏi về mảng tin tức, thì câu trả lời nhận được như sau.

“Tôi xin lỗi, nhưng tôi không thể truy cập bất kỳ tin tức hiện tại nào vì dữ liệu đào tạo của tôi chỉ có hạn cho đến năm 2021 và tôi không có khả năng duyệt web. Có bất cứ điều gì khác tôi có thể giúp bạn với?”

Chưa trả lời được những câu hỏi ở mức suy luận phức tạp và nâng cao

Nếu bạn hỏi ChatGPT các câu hỏi yêu cầu suy luận 3 bước, thì câu trả lời nhận được sẽ chưa chính xác. Ví dụ như trong hình sau:

ChatGPT là gì? Tất cả thông tin quan trọng cần biết về ChatGPT

Nếu bạn có dữ liệu A là bố của B; B là bố của C, thì ChatGPT có thể trả lời đúng mối quan hệ giữa A và C. Nhưng nếu bạn thêm 1 bước nữa; C là chồng của D, thì ChatGPT sẽ không trả lời đúng mối quan hệ giữa A và D.

Câu trả lời không đảm bảo là lúc nào cũng đúng

Có một số ứng dụng trong thực tế đòi hỏi độ chính xác cao, ví dụ từ 95-100%, tuy nhiên ChatGPT vẫn đang ở bước kiểm thử, và vẫn chưa đảm bảo rằng các câu trả lời từ ChatGPT đều luôn đúng.

Đòi hỏi cấu hình máy tính mạnh để chạy phần mềm

ChatGPT yêu cầu một lượng điện toán (computational power) đáng kể để chạy, điều này có thể gây khó khăn cho việc triển khai trong một số môi trường.

Vấn đề về quyền riêng tư

Một mối quan tâm khác khi sử dụng ChatGPT là tác động tiềm ẩn về quyền riêng tư. Vì ChatGPT có thể giữ lại và sử dụng thông tin từ các cuộc trò chuyện trước đó nên có thể có những lo ngại về cách thu thập và lưu trữ dữ liệu cá nhân của ChatGPT. Đây là một vấn đề quan trọng mà các nhà phát triển và người dùng ChatGPT sẽ cần xem xét cẩn thận trong tương lai.

Chưa hỗ trợ tốt cho các ngôn ngữ khác

Nếu bạn hỏi ChatGPT trên các ngôn ngữ khác, ví dụ như tiếng Việt, thì bạn dễ dàng tìm được câu trả lời sai của ChatGPT.

Trong ví dụ trên, ChatGPT đã trả lời sai. “Sài Gòn nằm trên sông Sài Gòn và là thủ đô của nước Việt Nam” hay “Bình Định về phía nam” (việc nói Bình Định giáp với Bình Định là một câu trả lời chưa hợp lý).

Ưu điểm của ChatGPT là gì?

Ngoài khả năng viết chương trình, tìm lỗi, sửa lỗi, phát hiện lỗ hổng bảo mật, sáng tác thơ, … Sau đây là một số ưu điểm của ChatGPT:

  • Như chúng ta quan sát ở một số câu trả lời của ChatGPT. Chúng ta có thể thấy rằng có những câu trả lời hoặc văn bản có chất lượng khá cao. Điều này có thể giúp tạo ra nội dung đa dạng và hấp dẫn hơn trong tương lai.
  • Có khả năng trả lời giống như con người đối với nhiều loại dữ liệu đầu vào khác nhau. Điều này làm cho ChatGPT trở nên lý tưởng cho các ứng dụng như chatbot và trợ lý ảo.
  • Có khả năng học hỏi và thích nghi với các bối cảnh mới (new contexts). Không giống như một số mô hình xử lý ngôn ngữ tự nhiên (NLP) khác, ChatGPT có thể lưu giữ thông tin từ các cuộc trò chuyện trong quá khứ và sử dụng những thông tin này để tạo phản hồi phù hợp và được cá nhân hóa hơn. Điều này cho phép ChatGPT cung cấp trải nghiệm người dùng tự nhiên và trực quan hơn.

ChatGPT được tạo ra như thế nào?

Theo mô tả từ trang web openai.com, “Chúng tôi đã đào tạo mô hình này bằng cách sử dụng Học tăng cường từ phản hồi của con người (Reinforcement Learning from Human Feedback - RLHF), sử dụng các phương pháp tương tự như InstructGPT, nhưng có một số khác biệt nhỏ trong việc thiết lập quá trình thu thập dữ liệu.”

Quá trình huấn luyện ChatGPT bao gồm 3 bước chính như sau:

Bước 1: Thu thập dữ liệu và huấn luyện một mô hình chính sách bằng cách sử dụng việc học có giám sát (supervised fine-tuning/learning).

Bước 2: Thu thập dữ liệu so sánh và huấn luyện một mô hình phần thưởng (a reward model).

Bước 3: Tối ưu hóa chính sách (ở bước 1) so với mô hình phần thưởng (ở bước 2) bằng thuật toán học tăng cường PPO.

PPO là từ viết tắt của từ Proximal Policy Optimization, là một thuật toán trong học tăng cường, được OpenAI giới thiệu vào tháng 7/2017.

ChatGPT là gì? Tất cả thông tin quan trọng cần biết về ChatGPT
Hình ảnh mô tả các bước trong quá trình huấn luyện ChatGPT. (Ảnh chụp màn hình từ trang web openai.com)

Chi tiết về dữ liệu:

Ở bước 1, dữ liệu được thu thập như sau: những người có chuyên môn về tạo dữ liệu cho AI, đóng cả hai vai trò, người dùng, và trợ lý AI. Họ truy cập vào các mô hình khác mà có thể cung cấp cho họ các ý tưởng để viết các kịch bản trong đoạn hội thoại giữa người dùng và trợ lý AI.

Dữ liệu cuối cùng dùng cho việc huấn luyện ở bước 1 là dữ liệu kết hợp giữa các đoạn hội thoại này (được tạo ra như mô tả ở trên) và dữ liệu InstructGPT (sau khi đã chuyển sang dạng hội thoại).

Ở bước 2, dữ liệu được tạo ra bằng cách sử dụng các đoạn hội thoại giữa những người có chuyên môn về tạo dữ liệu cho AI và chatbot. Sau đó, các chuyên gia này sẽ sắp xếp thứ tự của các đoạn hội thoại này. Có thể sắp xếp theo thứ tự từ đạt kết quả cao đến cho kết quả thấp.

Cơ sở kiến thức của ChatGPT là gì?

Để tạo ra được ChatGPT, trước đó đã có rất nhiều công trình nghiên cứu khác.

Đầu tiên, phải để đến công trình nghiên cứu về Transformer, từ bài báo: Attention Is All You Need. Transformer có thể được sử dụng để dịch một câu hay đoạn văn từ một ngôn ngữ này sang một ngôn ngữ khác.

Ví dụ, chúng ta có một câu tiếng Việt và muốn dịch câu này sang tiếng Anh. Thì câu tiếng Việt gọi là câu đầu vào (input), sẽ được chuyển sang một biểu diễn khác, dạng số, ví dụ một vector với số chiều là 748. Hy vọng là vector này sẽ chứa tất cả thông tin cần thiết cho câu đầu vào. Sau đó, một bộ phận khác, sẽ tìm cách sinh ra một câu tiếng Anh (câu đầu ra - output), dựa vào vector 748 chiều này.

Thông tin về BERT và các mô hình khác

Nhờ sự thành công của Transformer, sau đó nhóm nghiên cứu Google đã tạo ra một mô hình ngôn ngữ khác, gọi là BERT. BERT đã cải tiến rất nhiều kết quả trong nhiều bài toán trong xử lý ngôn ngữ tự nhiên.

Sau đó, dần dần, có rất nhiều các mô hình ngôn ngữ khác đã được tạo ra; ví dụ như: RoBERTa, T5, VideoBERT, SpeechBERT, ALBERT, StructBERT, GPT, GPT3, DistilBERT, … Đến hiện tại, đã có rất nhiều mô hình ngôn ngữ khác nhau được tạo ra, và được sử dụng với các mục đích khác nhau.

Quý độc giả, có thể xem thêm bài này: Pre-trained Models for Natural Language Processing: A Survey.

Bài viết này giới thiệu ChatGPT là gì? Và tất cả thông tin quan trọng cần biết về ChatGPT. Nếu quý độc giả muốn tìm hiểu thêm về AI có thể xem thêm các bài bên dưới đây:

Nguồn tham khảo và kiến thức liên quan:

  • ChatGPT Advantages and Disadvantages: A Comprehensive Guide to the Pro - Reddit.com
  • Proximal Policy Optimization Algorithms - arXiv 2017
  • Attention Is All You Need - NIPS 2017
  • Training language models to follow instructions with human feedback - arXiv 2022
  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding - NAACL 2019

Khoa học Công nghệ


BÀI CHỌN LỌC

ChatGPT là gì? Tất cả thông tin quan trọng cần biết về ChatGPT