Nhân loại rất nhanh sẽ không thể kiểm soát được AI: Lịch sử phát triển mạng nơ-ron cho biết điều đó

Giúp NTDVN sửa lỗi

Có gì đó khác biệt ‘không thể giải thích' nằm sâu trong các mạng nơ-ron – cốt lõi của công nghệ AI. Cho đến nay, không một ai, kể cả cha đẻ của nó có thể hiểu được hệ thống này một cách đầy đủ.

Ngoài 20 tuổi, nhà toán học kiêm sinh học lý thuyết Jack D. Cowan đến thăm Wilfred Taylor và thấy một cỗ “máy biết học” kì lạ. Anh bị choáng ngợp bởi “tập hợp thiết bị khổng lồ” này. Cowan chỉ biết đứng trân trân quan sát – cỗ máy đang làm một “sơ đồ bộ nhớ liên kết” – có vẻ là nó có thể học để tìm ra các mối liên kết và trích xuất từ dữ liệu.

Trông nó giống như nhiều khối mạch điện được ráp nối thủ công bằng những cụm dây điện và hộp đấu nối. Những gì Cowan chứng kiến chính là một dạng analog của mạng nơ-ron – tiền thân của những mô hình trí tuệ nhân tạo (AI) tiên tiến nhất hiện nay, bao gồm cả ứng dụng ChatGPT. Bên trong công nghệ ChatGPT chính là một mạng nơ-ron.

Jack Cowan, người đóng vai trò quan trọng trong việc phát triển mạng lưới thần kinh từ những năm 1950 trở đi. (Ảnh: Đại học Chicago)

Thuật ngữ mạng nơ-ron bao gồm nhiều hệ thống đa dạng nhưng tựu trung lại, theo IBM, các mạng nơ-ron – hay còn được gọi là mạng nơ-ron nhân tạo (“artificial neural networks” – ANN) hoặc mạng nơ-ron mô phỏng (“simulated neural networks” – SNN) – là một khía cạnh của ‘học máy’ và cốt lõi của các ‘thuật toán học sâu’.

Điều quan trọng là “từ tên gọi cho đến cấu trúc của mạng nơ-ron đã được lấy cảm hứng từ bộ não con người, bắt chước cách các tế bào thần kinh sinh học truyền tín hiệu cho nhau”.

Ở thời kỳ đầu, người ta đã nghi ngờ về giá trị của các mạng nơ-ron này, nhưng theo thời gian, trào lưu AI đã mạnh mẽ đón nhận nó. Mạng nơ-ron giờ được hiểu là lịch sử và tương lai của AI. Chúng sẽ đem đến những tác động to lớn đến con người và ý nghĩa của việc làm người.

Gần đây chúng ta có thể thấy, toàn thế giới đang rộ lên những mối lo ngại như vậy cùng lời kêu gọi tạm dừng các phát triển AI mới trong khoảng thời gian sáu tháng để rà soát lại những tác động của chúng.

Mạng nơ-ron đang làm thay đổi cuộc sống chúng ta

Chắc chắn sẽ là một sai lầm nếu coi mạng nơ-ron chỉ là thứ đồ công nghệ bóng bẩy và bắt mắt. Thực chất thì chúng đã bắt rễ vào đời sống của chúng ta. Từ năm 1989, một nhóm nghiên cứu do Yann LeCun dẫn đầu tại Phòng thí nghiệm AT&T Bell đã sử dụng các kỹ thuật lan truyền ngược để đào tạo một hệ thống nhận diện chữ viết tay.

Microsoft gần đây thông báo rằng các tìm kiếm trên Bing sẽ được AI hỗ trợ, như là người đồng hành lướt web của người dùng.

Các mô hình AI được huấn luyện để tìm hình mẫu trên dữ liệu khổng lồ có thể làm các công việc như nhận dạng hình ảnh nhanh chóng – một ví dụ về ứng dụng là để nhận dạng khuôn mặt.

Mạng nơ-ron cũng đang thay đổi cách chúng ta dịch thuật và giao tiếp. Ví dụ sản phẩm “Google Translate” phát triển bởi nhóm có tên thú vị là “Google Brain” là một ứng dụng nổi bật khác của mạng nơ-ron.

Bạn chắc cũng không muốn đấu cờ Vua hay cờ vây với mạng nơ-ron. Khả năng thuộc các quy tắc và tổng hợp chiến thuật cũng như ghi nhớ từng đường đi nước bước khiến chúng đặc biệt xuất sắc trong những trò chơi này. Cũng chính những hệ thống dựa trên mạng nơ-ron đã hạ gục những kì thủ cờ vây và cờ vua ngoài đời thực.

Nhưng mạng nơ-ron còn có thể ảnh hưởng vượt xa những ví dụ trên. Nếu tìm kiếm các bằng sáng chế bởi từ khóa “mạng nơ-ron” sẽ cho ra 135.828 kết quả. Với tốc độ bành trướng nhanh chóng và liên tục thì chúng ta hầu như không còn cơ hội nào để hiểu được ảnh hưởng của AI nữa.

Những lớp bí ẩn của sự ‘không thể giải thích’

Nhìn lại lịch sử của mạng nơ-ron sẽ cho chúng ta thấy vài điều quan trọng trong những quyết định tự động hóa đang định hình hiện tại của chúng ta và có thể sẽ còn ảnh hưởng sâu sắc hơn trong tương lai của loài người. Càng ngày, chúng ta sẽ càng khó nắm bắt những quyết định và ảnh hưởng của AI.

Nhà phát minh mạng nơ-ron Walter Pitts (giữa) và Warren McCulloch (bên trái) năm 1949.

Mạng nơ-ron không chỉ là những hộp đen, cũng không chỉ là những phần tử ẩn giấu của một hệ thống lớn hơn mà ta không thể thấy hoặc hiểu được. Có gì đó khác biệt nằm sâu trong bản thân mục đích và thiết kế của các mạng nơ-ron.

Từ xưa đến nay, chúng ta luôn theo đuổi những gì không thể giải thích được. Hệ thống càng trừu tượng thì người ta càng nghĩ nó độc đáo và tiên tiến. Động cơ thúc đẩy sự phát triển của các mạng thần kinh này ẩn chứa mối quan tâm đặc biệt và sâu sắc tới “sự không thể giải thích”.

Sự bí ẩn này thậm chí được mã hóa trong mạng nơ-ron. Sâu bên trong các mạng nơ-ron gồm chồng chất nhiều lớp – từ đó mà có cụm từ học sâu – và giữa các lớp đó là những “lớp bí ẩn” thậm chí còn khó giải thích hơn.

Trí tuệ nhân tạo càng ảnh hưởng tới cuộc sống của chúng ta, chúng ta càng khó hiểu tại sao và làm thế nào lại như vậy. Ngày nay EU rất lo ngại về các ứng dụng chứa đựng những “rủi ro không thể giải thích” từ AI, họ thậm chí cho là “nguy hiểm”.

Họ đang thúc đẩy Đạo luật AI mới nhằm thiết lập một “tiêu chuẩn toàn cầu” cho việc phát triển hệ thống trí tuệ nhân tạo an toàn, tin cậy và hợp đạo đức”. Họ còn có nỗi lo lắng rằng những hệ thống này sẽ phát triển quá nhanh và xâm phạm đến nhân quyền.

Lấy cảm hứng từ bộ não con người

Mạng nơ-ron là một hệ thống phức tạp nhưng có thể tựu trung lại các nguyên tắc cốt lõi. Lấy cảm hứng từ bộ não con người, chúng hướng đến việc sao chép hoặc mô phỏng các dạng suy nghĩ sinh học và tư duy của con người.

Về cấu trúc và thiết kế, như IBM giải thích, chúng bao gồm “các lớp nút mạng (node): gồm một lớp đầu vào, một hoặc nhiều lớp ẩn và một lớp đầu ra”. Trong đó, “mỗi node, hay còn gọi là một nơ-ron nhân tạo, sẽ kết nối với các node khác”. Các node này đòi hỏi yêu cầu đầu vào và thông tin để có thể tạo ra các kết quả ở đầu ra, vì vậy, nó “dựa vào các dữ liệu huấn luyện để học và tăng cường độ chính xác qua thời gian”.

Trong một cuộc phỏng vấn năm 1993, nhà khoa học mạng nơ-ron Teuvo Kohonen đã kết luận, ông mong muốn có một hệ thống có thể “tự tổ chức”, hoạt động giống như “hệ thần kinh của con người làm việc một cách bản năng”. Để lấy một ví dụ, Kohonen hình dung ra một hệ thống “tự tổ chức” – một hệ thống tự quản lý và giám sát, “có thể sử dụng để điều khiển bất cứ máy móc nào, kể cả máy bay, máy bay phản lực, hay tất cả các nhà máy điện hạt nhân hoặc tất cả mọi loại xe ô tô”.

Tham vọng lớn là có một hệ thống có khả năng thích nghi với môi trường xung quanh. Nó sẽ tự chủ, phản ứng tức thời giống như hệ thần kinh. Đó là giấc mơ về những hệ thống có thể tự hoạt động mà hầu như không cần sự can thiệp của con người. Sự phức tạp và bí ẩn của bộ não, của hệ thần kinh con người và thế giới thực sẽ sớm cho ta biết sự phát triển và cách thức thiết kế của mạng nơ-ron máy tính.

Sự phức tạp và bí ẩn của bộ não, của hệ thần kinh con người và thế giới thực sẽ sớm cho ta biết sự phát triển và cách thức thiết kế của mạng nơ-ron máy tính. Ảnh: Pixabay

`Có điều gì đó thực sự đáng ngờ’

Quay trở lại năm 1956 và cỗ máy tự học kỳ lạ đó, chính cách tiếp cận “học qua hành” của Taylor khi xây dựng chiếc máy đã ngay lập tức thu hút sự chú ý của Cowan. Cowan nhận thấy Taylor, qua cuộc nói chuyện về hệ thống của mình, “không hề chế tạo cỗ máy dựa trên lý thuyết nào, cũng chẳng mô phỏng gì trên máy tính”.

Thay vào đó, với các công cụ trong tay, Taylor “thực sự tạo ra thiết bị đó hoàn toàn thủ công”. Đó chỉ là một khối vật chất, tạo ra bằng sự kết hợp giữa các linh kiện với nhau. Và nó “được hoàn thiện bởi các mạch điện analog”, Taylor đã sử dụng nhiều năm để xây - thử nghiệm - loại bỏ - xây - và hoàn thiện nó. Đó là một dạng phát triển sản phẩm theo phương pháp “thử và sai’.

Cũng dễ hiểu là Cowan rất muốn nắm bắt được công nghệ này. Anh cố nài Taylor giải thích chiếc máy biết học này cho mình. Nhưng chẳng có gì là rõ ràng. Cowan không tài nào khiến Taylor mô tả chiếc máy này thực sự hoạt động thế nào.

Những nơ-ron analog này vẫn cứ là một bí ẩn. Vấn đề đáng ngạc nhiên hơn, Cowan nghĩ, là chính Taylor “cũng không thực sự hiểu điều gì đang diễn ra”. Nó không chỉ là một khoảng lặng trong giao tiếp giữa hai nhà khoa học ở hai lĩnh vực khác nhau, mà còn hơn thế.

Khi nghĩ lại về cỗ máy của Taylor nhiều chục năm sau, Cowan đã tiết lộ rằng “thậm chí đến bây giờ với vô vàn công bố về mạng nơ-ron, người ta vẫn chưa thể hiểu rõ về cách thức hoạt động của nó”.

Kết luận này cho thấy sự “không thể giải thích” ẩn sâu trong các mạng nơ-ron như thế nào. Tính không thể giải thích được của các mạng nơ-ron này đã xuất hiện ngay từ giai đoạn đầu và đã tồn tại suốt gần bảy thập kỷ qua.

Điều bí ẩn này vẫn còn cho đến ngày nay và tồn tại ở cả những mô hình AI tiên tiến nhất. Sự “không thể hiểu được cách hoạt động” của các phiên bản khác của cỗ máy Taylor khiến Cowan tự hỏi liệu có “điều gì đó đáng ngờ về mạng nơ-ron”.

Lần tìm manh mối

Cowan nhớ lại vào những năm 1960, người ta có vẻ “chậm nhận ra mục đích của mạng nơ-ron analog”. Chuyên gia về mạng nơ-ron từng đoạt giải Nobel Leon N. Cooper cho rằng những nghiên cứu về những ứng dụng xung quanh mô hình não bộ vào những năm 1960 được cho là một trong những “bí ẩn không thể giải thích được”. Sự bất định này đã khiến người ta hoài nghi về khả năng mạng nơ-ron có thể làm được gì. Nhưng mọi thứ bắt đầu dần thay đổi.

Khoảng 30 năm trước, nhà thần kinh học Walter J. Freeman đã rất ngạc nhiên trước mức độ ứng dụng đáng kinh ngạc mà người ta phát hiện ra của mạng nơ-ron, cho rằng thực chất thì ông không coi chúng là “một loại máy móc với nguyên lý mới”. Thật vậy, để tìm ra gốc rễ của công nghệ mạng nơ-ron chúng ta cần phải quay ngược lại xa hơn chuyến thăm của Cowan tới cỗ máy bí ẩn của Taylor.

Nhà khoa học mạng nơ-ron James Anderson và nhà báo khoa học Edward Rosenfeld cho rằng nền tảng của mạng nơ-ron có từ những năm 1940 khi người ta cố gắng “hiểu hệ thống thần kinh của con người và xây dựng hệ thống nhân tạo có thể bắt chước, hoặc là một thứ gì đó tương tự như thế”. Và vì vậy, vào những năm 1940, những bí ẩn của hệ thần kinh của con người cũng chính là bí ẩn của tư duy máy tính và trí tuệ nhân tạo.

Để tóm lại câu chuyện dài này, người chuyên viết về khoa học máy tính Larry Hardesty đã cho rằng công nghệ học sâu dưới hình thức mạng nơ-ron thực chất “đã liên tục nóng lên rồi nguội đi trong suốt 70 năm qua”. Cụ thể hơn, ông nói rằng “những mạng nơ-ron lần đầu được đề xuất vào năm 1944 bởi Warren McCulloch và Walter Pitts. Hai nhà nghiên cứu này đến từ Đại học Chicago, sau đã chuyển đến MIT vào năm 1952 và là các thành viên sáng lập của khoa Khoa học nhận thức đầu tiên ở Mỹ”.

Từ những năm 1960 đến cuối những năm 1970, chúng ta có thêm những câu chuyện về những đặc tính chưa biết của những hệ thống này. Sau ba thập kỷ thì mạng nơ-ron nhân tạo vẫn chưa tìm thấy khả năng ứng dụng nào. David Rumelhart, nhà tâm lý học và đồng tác giả của một loạt sách xuất bản năm 1986 đã thu hút sự chú ý trở lại về mạng nơ-ron, đã cộng tác với đồng nghiệp Jay McClelland để phát triển những mạng nơ-ron.

Sau bài nói chuyện của Rumelhart ở một hội nghị tại Minesota, McClelland đã trở về với ý tưởng phát triển một mạng nơ-ron kết hợp nhiều mô hình để có khả năng tương tác. Và cách Rumelhart làm là “hàng giờ, hàng giờ mày mò với phần cứng máy tính”. Giống như Taylor, Rumelhart cũng “thử và sai”. Họ đã tạo ra những mạng nơ-ron có thể hoạt động, nhưng quan trọng là họ cũng không hiểu cách thức, nguyên nhân tại sao nó hoạt động theo cách đó, tức là học hỏi từ dữ liệu và tìm kiếm các mối liên hệ.

Bắt chước bộ não người – hết lớp này đến lớp khác

Bộ não con người – cho đến nay vẫn là một trong những bí ẩn khoa học chưa có lời giải thấu đáo – chính là khung thiết kế của các hệ thống sử dụng mạng nơ-ron.

Điện toán ban đầu thường liên quan đến một bộ máy lớn gồm các bộ phận lắp ráp. (Ảnh: Đại học Aalto)

Năm 1998, James Anderson, người đã từng làm việc một thời gian trên mạng lưới thần kinh nói rằng, khi nghiên cứu về bộ não thì “khám phá chính của chúng tôi là chúng tôi thực sự không hiểu những gì đang hoạt động trong bộ não”.

Trong một bài tường thuật chi tiết trên Financial Times năm 2018, nhà báo Richard Waters viết các mạng nơ-ron “được mô hình hóa dựa trên một lý thuyết về cách thức hoạt động của bộ não con người, truyền dữ liệu qua các lớp tế bào thần kinh nhân tạo cho đến khi nó nhận ra một hình mẫu nào đó”.

Điều này tạo ra một suy nghĩ thú vị, Waters cho biết, vì “không giống như các mạch logic được sử dụng trong chương trình phần mềm truyền thống, không có cách nào theo dõi quá trình này để xác định chính xác lý do tại sao máy tính đưa ra một câu trả lời cụ thể”.

Walter kết luận, không thể truy nguyên những kết quả mà mạng nơ-ron đưa ra. Việc áp dụng loại mô hình dựa trên bộ não lấy dữ liệu qua nhiều lớp, có nghĩa là câu trả lời của lớp cuối cùng không thể dễ dàng truy ngược lại các lớp trước. Cấu trúc nhiều lớp chính là nguyên nhân của vấn đề này.

Hardesty nhận thấy các hệ thống này mới chỉ “mô phỏng một cách đơn giản nhất về bộ não của con người”. Có nghĩa là còn có thể xây dựng những hệ thống xử lý phức tạp hơn, ngày càng gần giống với bộ não. Và kết quả là ngày nay người ta đã xây dựng các mạng nơ-ron “có hàng nghìn hoặc thậm chí hàng triệu node xử lý các tác vụ đơn giản kết nối với nhau dày đặc”. Hardesty quan sát thấy rằng “một node riêng lẻ có thể được kết nối và nhận dữ liệu từ rất nhiều node ở trước nó, rồi gửi dữ liệu tới một số mode ở lớp sau nó”.

Những lớp bí ẩn

Khi các lớp dày lên, học sâu sẽ tạo ra những độ sâu mới. Hardesty giải thích rằng người ta huấn luyện mạng nơ-ron bằng dữ liệu “truyền dữ liệu ở lớp đáy – lớp đầu vào – và sau đó đi qua các lớp sau, rồi được nhân lên, cộng lại theo những cách phức tạp, cho đến khi nó đi tới lớp cuối cùng. Dữ liệu đã được biến đổi hoàn toàn ở lớp đầu ra này”.

Càng nhiều lớp, sự biến đổi càng lớn và sự khác biệt giữa đầu vào và đầu ra càng lớn. Sự phát triển của Bộ xử lý đồ họa (GPU), Hardesty nói thêm, “đã đưa mạng nơ-ron một lớp của những năm 1960 và mạng nơ-ron hai đến ba lớp của những năm 1980 bùng nổ thành mạng 10, 15 và thậm chí 50 lớp ngày nay”.

Mạng nơ-ron ngày càng sâu hơn. Thật vậy, theo Hardesty, chính việc thêm các lớp này là “sự ‘sâu’ và ‘học sâu’ mà chúng ta thường nói đến”. Đây là điều đáng kể, ông đề xuất, bởi vì “hiện tại học sâu đang là nền tảng của các hệ thống máy tính AI tốt nhất trong hầu hết mọi lĩnh vực nghiên cứu trí tuệ nhân tạo”.

Nhưng bí ẩn cũng sâu hơn. Khi các lớp của mạng thần kinh ngày càng chồng chất thì độ phức tạp của chúng cũng tăng lên. Nó cũng dẫn đến sự phát triển của cái được gọi là “các lớp bí ẩn” giữa những độ sâu này.

Cuộc thảo luận về số lớp bí ẩn tối ưu trong mạng thần kinh đang diễn ra. Nhà lý thuyết truyền thông Beatrice Fazi đã viết rằng “vì một mạng nơ-ron hoạt động dựa trên những lớp nơ-ron bí ẩn kẹp giữa lớp nơ-ron đầu tiên (lớp đầu vào) và lớp cuối cùng (lớp đầu ra), kỹ thuật học sâu thường trừu tượng và mơ hồ kể cả với những lập trình viên đầu tiên xây dựng nó”.

Nhà tư tưởng truyền thông liên ngành mới nổi Katherine Hayles đưa ra quan điểm tương tự: đang có những giới hạn về “mức độ chúng ta có thể biết về hệ thống, một hệ quả do các ‘lớp bí ẩn’ trong mạng lưới thần kinh và các thuật toán học sâu”.

Theo đuổi điều ‘không thể giải thích'

Tóm lại, quá trình phát triển lâu dài của mạng nơ-ron là một phần của cái mà nhà xã hội học công nghệ Taina Bucher gọi là “vấn đề của sự không thể giải thích”.

Harry Collins – nhà xã hội học người Anh, tác giả cuốn sách: Trí tuệ nhân tạo: Con người không thể đầu hàng máy tính, đã chỉ ra rằng mục tiêu của mạng nơ-ron là dù chúng có thể cần con người khởi tạo ban đầu, nhưng “một khi chương trình được viết ra, nó sẽ sống cuộc sống của chính nó, tự chủ; nếu không có một nỗ lực thật sự lớn, thì cách mà mạng nơ-ron hoạt động như thế nào sẽ vẫn mãi là một bí ẩn”.

Dĩ nhiên điều đó sẽ có thể làm tổn hại đến sự sống của nhân loại. Khi AI tiếp tục phát triển và vượt quá khả năng hiểu biết của chúng ta, nó có thể định hình những phát hiện của chúng ta, cách chúng ta đối xử, cách chúng ta học hỏi và tương tác với nhau.

Chính vì thế mà chúng ta càng khao khát muốn biết điều gì đằng sau hệ thống đó. Khi nói về việc tạo ra một hệ thống AI rõ ràng và minh bạch, câu chuyện lịch sử về mạng nơ-ron cho chúng ta thấy rằng, loài người sẽ càng rời xa mục tiêu đó trong tương lai hơn là tiến gần hơn đến nó.

Theo The Conversation

Tác giả: David Beer - Giáo sư Xã hội học, Đại học York, Vương Quốc Anh

Ánh Dương lược dịch

Khoa học Công nghệ


BÀI CHỌN LỌC

Nhân loại rất nhanh sẽ không thể kiểm soát được AI: Lịch sử phát triển mạng nơ-ron cho biết điều đó