Những giới hạn trí tuệ máy tính và những bài toán chưa có lời giải nhiều thế kỷ qua
Nhà toán học lớn Gottfried Leibniz đã khởi xướng câu hỏi dành cho nhiều thế kỷ “vấn đề ra quyết định” Entscheidungsproblem và các nhà toán học gần 300 năm sau đấy đã từng nghĩ rằng mọi thứ đúng đều có bằng chứng toán học. Một hệ thống có thuộc tính như vậy được gọi là hoàn chỉnh và đầy đủ; một hệ thống không có được như vậy được gọi là không đầy đủ. Ngoài ra, các ý tưởng toán học không nên có mâu thuẫn nhau. Điều này có nghĩa là chúng không nên đúng và sai cùng một lúc.
Một hệ thống không chứa đựng những mâu thuẫn được gọi là nhất quán. Các hệ thống này đều dựa trên các bộ tiên đề cho trước. Tiên đề là những tuyên bố được chấp nhận là đúng và không cần chứng minh. Thế nhưng điều này đã bị Kurt Godel và Alan Turing phủ định vào những năm 1930s. Godel đã chứng minh rằng không thể tạo ra một bộ tiên đề vạn năng có thể giải thích mọi thứ trong toán học. Điều này tương tự như lập luận của Turing: có những vấn đề tính toán không thể giải quyết được bất kể sức mạnh tính toán và thời gian chạy đến đâu. Cho dù thuật toán có thể truy cập bao nhiêu dữ liệu với thời gian vô tận đến đâu thì nó cũng sẽ không bao giờ có thể tạo ra mạng nơ ron nhân tạo toàn hảo như con người mong muốn. Có hàng trăm giả thuyết toán học đến nay chưa có lời giải dù chúng ta có được sự hỗ trợ của máy tính hiện đại với bộ nhớ ngày càng lớn và tốc độ tính toán ngày càng nhanh. Giới hạn trí tuệ máy tính là bài toán mà nhà toán học lớn của thế kỷ 20-21 Steve Smale đã coi là thách thức của thế kỷ 21 và có thể là nhiều thế kỷ sau đấy.
1. Gödel-Turing và những giới hạn của trí tuệ máy tính
Chúng ta đang sống trong kỷ nguyên công nghệ và trí tuệ nhân tạo đang trong giai đoạn đóng một vai trò ngày càng quan trọng trong cuộc sống của chúng ta. Thế nhưng chúng ta luôn cần đặt một câu hỏi lớn: “sự hạn chế của trí tuệ nhân tạo của máy là gì?”
Con người chúng ta thường khá giỏi trong việc nhận ra khi nào hành động của mình đang làm có gì sai không đúng, nhưng hệ thống trí tuệ nhân tạo AI thì không giống vậy. Theo các nghiên cứu mới gần đây từ năm 2022, năm AI tạo sinh tên là ChatGPT chính thức bước vào cuộc sống của xã hội chúng ta, thì AI nhìn chung gặp phải rất nhiều hạn chế và những hạn chế này có nguồn gốc từ một giả thuyết toán học không có lời giải đáp đã kéo dài hàng thế kỷ.
Nếu như con người chúng ta quá tự tin vào AI có thể giải quyết mọi vấn đề, hệ thống AI được tạo ra bởi con người chúng ta sẽ tự động có một sự tự tin vượt xa khả năng thực tế của chúng. Khi con người chúng ta quá tự tin vào AI trong khi nhiều hệ thống AI không biết khi nào chúng mắc lỗi, chúng ta sẽ đặt bản thân mình trước nhiều rủi ro. Rất nhiều hệ thống AI còn khó nhận ra khi nào nó mắc lỗi hơn là khi nào nó tạo ra kết quả chính xác.
Giáo sư Anders Hansen và Tiến sĩ Matt Colbrook từ Khoa Toán ứng dụng và Vật lý lý thuyết của Đại học Cambridge của Anh, cho rằng sự bất ổn, không thể nhất quán trong mọi trường hợp chính là điểm yếu chí tử của AI hiện đại chính là những bài toán đã tồn tại hàng thế kỷ trước đây.
Chỉ trong những trường hợp rất cụ thể, thuật toán mới có thể tính toán mạng nơ ron nhân tạo ổn định và chính xác đến đâu. Có tồn tại một thuật toán xác đinh được thuật toán khác đúng hay sai đã là một câu hỏi được nêu ra cách đây gần 400 năm.
1.1 Bài toán hơn 300 năm tuổi mang tên “Vấn đề ra quyết định” Entscheidungsproblem của Leibniz -Hilbert-Ackermann là nền tảng giới hạn của trí tuệ máy tính
Trong Hội thảo toán học quốc tế lớn vào năm 1928, câu hỏi nổi tiếng mang tên Entscheidungsproblem (tiếng Đức, có nghĩa là “Vấn đề ra quyết định”) là một thách đố do 2 nhà toán học lớn của thế kỷ 20 là David Hilbert và Wilhelm Ackermann đặt ra như một thách thức đối với toàn bộ cộng đồng toán học thế giới trong thế kỷ 20. Bài toán yêu cầu một thuật toán xem xét một câu lệnh làm đầu vào và trả lời "có" hoặc "không" tùy thuộc vào câu lệnh đó có giá trị hay không trong mọi cấu trúc. Nghĩa là, có tồn tại một thuật toán quyết định liệu bất cứ một phát biểu toán học nào là đúng hay sai.
Nguồn gốc của bài toán Entscheidungs bắt nguồn từ nhà toán học và sáng chế Gottfried Leibniz (thế kỷ 17), sau khi chế tạo thành công một chiếc máy tính toán cơ học đã mơ ước chế tạo một chiếc máy có thể thao tác các ký hiệu nhằm xác định giá trị đúng hay sai của các phát biểu toán học.
Câu trả lời cho bài toán “Vấn đề ra quyết định” nổi tiếng của Leibniz và Hilbert đã được trả lời là phủ định bởi hai người khổng lồ toán học là Kurt Godel và Alan Turing trong những năm 1930.
1.2 Câu trả lời phủ định đối với bài toán “Vấn đề ra quyết định” của Kurt Godel và Alan Turing
Hàng thế kỷ, các nhà toán học từng tin rằng mọi thứ đúng đều có bằng chứng toán học. Một hệ thống có thuộc tính như vậy được gọi là hoàn chỉnh và đầy đủ; một hệ thống không có được như vậy được gọi là không đầy đủ. Ngoài ra, các ý tưởng toán học không nên có mâu thuẫn. Điều này có nghĩa là chúng không nên đúng và sai cùng một lúc. Một hệ thống không chứa đựng những mâu thuẫn được gọi là nhất quán. Các hệ thống này đều dựa trên các bộ tiên đề cho trước. Tiên đề là những tuyên bố được chấp nhận là đúng và không cần chứng minh.
Năm 1931, Kurt Gödel (1906-1978), người được nhiều nhà toán học lớn tán dương là Albert Einstein trong toán học, đã đưa ra một chứng minh làm thay đổi toàn bộ thế giới quan của giới toán học thế giới khi ông đã chứng minh được rằng mọi hệ thống toán học dù phong phú đến đâu cũng đều không đầy đủ hoặc không nhất quán. Cụ thể hơn, nếu một hệ tiên đề đủ phong phú để tạo ra toán học thì nó không bao giờ có thể được chứng minh là phi mâu thuẫn. Một hệ như thế vốn dĩ không đầy đủ, tức là bất toàn. Lí thuyết toán học còn như vậy, lĩnh vực trí tuệ nhân tạo còn giới hạn hơn nhiều.
Như chúng ta đã biết, trí tuệ nhân tạo còn có thể hiểu là một ngành khoa học giúp cho hệ thống máy tính có khả năng nhận biết, lập luận, suy diễn, ra kết luận, giao tiếp, tự thích nghi và biết học dựa trên những dữ liệu tìm kiếm. Về cơ bản, trí tuệ nhân tạo tập trung nghiên cứu phần tri thức không chắc chắn, tản mạn và mờ. Trí tuệ nhân tạo thường được dạy để thực hiện các nhiệm vụ theo những gì nó đã biết, nhưng nó không thể đưa ra quyết định khi gặp phải những tình huống vượt quá những gì nó đã học được. Bên cạnh đó, trí tuệ nhân tạo lấy dữ liệu làm đầu vào. Hiện nay, dữ liệu ngập tràn những thông tin sai (nhất là các thông tin giả được tạo ra từ các AI tạo sinh) được phổ cập nhanh hơn nhiều so với thông tin thật, vô tình tạo ra những điểm yếu của trí tuệ nhân tạo khi nó dễ dàng bị đánh lừa. Trong khi đó, con người với sự thức tỉnh và nhận thức có thể nhận ra.
Chúng ta thấy luôn có những câu hỏi không thể trả lời bằng suy luận logic từ một bộ tiên đề nhất định; Không thể chứng minh rằng một hệ tiên đề là nhất quán, trừ khi bạn sử dụng một bộ tiên đề khác.
Gödel đã chỉ ra một vấn đề cốt lõi của toán học. Trong bất kỳ hệ thống toán học nào dù phong phú đến mức có thể mô tả số học của các số tự nhiên, sẽ luôn có những mệnh đề không thể chứng minh được là đúng hay sai từ các tiên đề của hệ thống này và cũng không thể chứng minh được rằng các tiên đề này không mâu thuẫn với nhau. Turing cũng chứng mình rằng một số vấn đề tính toán không thể giải quyết được bằng thuật toán.
Đến năm 1999, nhà toán học lớn của thế kỷ 21 là Steve Smale đã tiếp nối truyền thống Hilbert, đề xuất danh sách một số bài toán chưa giải được của thế kỷ 21. Trong các bài toán này, thì có bài toán liên quan đến giới hạn trí tuệ của máy tính. Như vậy Smale đã tích hợp toán học vào AI và công nghệ thông tin. Giờ đây thay vì chỉ nghiên cứu toán lý thuyết thuần túy, các nhà toán học thế kỷ 21 đã đưa những bài toán kết hợp toán học và giới hạn của trí tuệ máy của Leibniz, Hilbert, Godel và Turing như một trong những vấn đề quan trọng của toán học thế kỷ 21.
Các nhà nghiên cứu nhận thấy rằng, do lời giải đáp phủ định “vấn đề ra quyết định” của Godel và Turing, nên có thể suy ra một mạng nơ ron nhân tạo AI tốt có thể tồn tại nhưng không thể xây dựng được một mạng nơ ron nhân tạo đáng tin cậy với tính đầy đủ và nhất quán trong mọi trường hợp. Cho dù dữ liệu của bạn có chính xác đến đâu, bạn cũng không bao giờ có thể có được thông tin hoàn hảo để xây dựng mạng nơ ron AI đầy đủ và nhất quán. Điều này tương tự như lập luận của Turing: có những vấn đề tính toán không thể giải quyết được bất kể sức mạnh tính toán và thời gian chạy đến đâu. Cho dù thuật toán có thể truy cập bao nhiêu dữ liệu với thời gian vô tận đến đâu thì nó cũng sẽ không bao giờ có thể tạo ra mạng nơ ron nhân tạo toàn hảo như con người mong muốn.
2. Những tranh cãi đúng hay sai: Những mệnh đề chưa có lời giải hàng thế kỷ
Có thể thấy rằng, để hiểu sâu hơn những gì Turing và Godel đã làm, chúng ta hãy cùng nhau tìm hiểu sâu hơn thông qua các ví dụ trong cuộc sống cũng như trong toán học nhiều năm qua. Trong cuộc sống mỗi ngày, chúng ta luôn thấy có rất nhiều cuộc tranh luận sôi nổi, từ trong gia đình nhỏ bé của chúng ta ra đến các chủ đề nóng bỏng nhiều ý kiến trái chiều.
Mọi sự tranh cãi đều bắt nguồn từ việc ủng hộ hay phủ nhận một câu nói là đúng hay là sai. Việc xác định đúng hay sai này là một nền tảng quan trọng đã được xây dựng từ những nền minh văn xa xưa của con người. Cả phương Đông và phương Tây đều tự xây dựng cho mình một hệ thống suy luận logic để xác định một câu nói hay còn gọi là một mệnh đề (Statement/ Proposition) là đúng hay là sai.
Có rất nhiều mệnh đề chúng ta có thể dễ dàng phân biệt đúng hay sai với những ví dụ sau:
Mệnh để 2.1: 1+1 = 2; Mệnh đề 2.2: 5x3 = 20
Chúng ta có thể dễ dàng nhận thấy mệnh đề 1 là đúng trong khi mệnh đề 2 là sai. Nhưng có rất nhiều mệnh đề chúng ta không thể xác định được đúng hay sai. Một trong những chủ đề nóng với nhiều ý kiến trái chiều của y học hiện đại ngày nay là:
Mệnh đề 2.3: Tâm thức chúng ta có thể chữa lành bệnh tật trên cơ thể chúng ta hay không.
Trường Y tế cộng đồng của Đại học Harvard trong năm 2021 đã đưa ra ý kiến sau:
“Tâm thức của bạn có thể là một công cụ chữa lành mạnh mẽ khi có cơ hội. Ý tưởng cho rằng bộ não của bạn có thể thuyết phục cơ thể bạn áp dụng một phương pháp điều trị giả là có thật, cái gọi là hiệu ứng giả dược và do đó kích thích quá trình chữa lành đã tồn tại trong nhiều thiên niên kỷ. Hiện nay khoa học đã phát hiện ra rằng trong những trường hợp thích hợp, giả dược có thể có hiệu quả tương đương với các phương pháp điều trị truyền thống”.
Như vậy sức mạnh của tâm thức chúng ta đối với việc chữa lành cơ thể mình là một điều mà giới y khoa phương Tây không hoàn toàn đồng tình nhưng ở y học truyền thống phương Đông đã từ lâu tin rằng: “mọi thứ do tâm bạn tạo ra”. Dù chỉ với một mệnh đề, chúng ta có thể có nhiều quan điểm trái chiều nhau và không dễ dàng thống nhất với nhau. Câu hỏi là tại sao lại như vây?
Câu trả lời chúng ta thường sẽ đổ cho là chúng ta không hợp nhau, hay có những niềm tin khác biệt nhau. Vậy những niềm tin này là gì và tại sao từ những niềm tin này chúng ta lại suy ra được chúng ta khác biệt nhau trong việc xác định một mệnh đề là đúng hay sai.
Mọi suy luận logic về bản chất đều cần dựa trên một hệ thống các tiên đề, là những thứ chúng ta đặt “niềm tin” nhưng không thể chứng minh được đúng hay sai. Dựa trên bộ tiên đề, chúng ta xác định nhiều mệnh đúng hay sai. Chứng minh một mệnh đề đúng hay sai là một chuỗi các suy luận logic từ hệ tiên đề đã có để ra xác định mệnh đề đó đúng hay sai.
Khi chúng ta thay đổi các hệ tiên đề, chúng ta sẽ có một hệ thống niềm tin mới và sẽ suy luận logic ra những điều mới: những định lý, bổ đề và hệ quá mới, có thể rất khác biệt hay trái ngược với những gì chúng ta đã có dựa trên hệ tiên đề cũ. Ví dụ chúng ta hãy cùng quay lại hệ năm tiên đề Euclide là gốc rễ của hình học Euclide đứng vững hơn 2.000 năm cho đến thế kỷ 17-18.
Tiên đề 1: Với hai điểm bất kỳ khác nhau, (a) tồn tại một đường thẳng chứa hai điểm đó và (b) đường thẳng này là duy nhất.
Tiên đề 2: Một đường thẳng có thể kéo dài vô tận ở cả hai đầu.
Tiên đề 3: Một đường tròn có thể được tạo lập khi biết hai yếu tố: a) điểm nào là tâm đường tròn và b) độ dài là bao nhiêu cho bán kính của đường tròn.
Tiên đề 4: Mọi góc vuông đều bằng nhau và bằng 90 độ
Tiên đề 5: Với mọi đường thẳng L và điểm p không thuộc L, (a) tồn tại một đường thẳng đi qua p không cắt L, và (b) đường thẳng này là duy nhất.
Mãi đến thế kỷ 17 và 18, con người chúng ta bắt đầu thay đổi hay loại bớt một số tiên đề trong bộ năm tiên đề này của Euclide và chúng ta tạo ra rất nhiều loại hình học mới mang tên phi Euclide hoặc tổng quát hóa hình học Euclide với vô số các định lý mới có tính chất trái ngược với hình học Eulcide.Vào thế kỷ 18, nhà toàn học Leonhard Euler đã đề xuất hình học Affine với ý tưởng dựa trên hình học Euclide nhưng bỏ qua các khái niệm về độ dài và góc.
Mặt phẳng Affine là một hệ thống các điểm và đường thẳng thỏa mãn ba tiên đề còn lại được trình bày đơn giản như sau:
Tiên đề 1: Tồn tại ít nhất ba điểm không thẳng hàng.
Tiên đề 2: Hai điểm xác định duy nhất một đường thẳng.
Tiên đề 3: Cho bất kỳ đường thẳng L nào và điểm P không thuộc L, tồn tại đúng một đường thẳng chứa P không cắt L. Chúng ta nói rằng đường thẳng này song song với L.
Ý tưởng đơn giản hóa bằng việc “bỏ quên” các tiên đề liên quan đến đo đạc của Euler là một ý tưởng đột phá và vô cùng quan trọng, chính ý tưởng này sau này cũng đã giúp nhà toán học Bernard Reimmann phát triển thành lý thuyết Topology, hình học của phi đo đạc.
Thay vì Euler và Gerard Desargues đã “bỏ quên” 2 đến 3 trong 5 tiên đề của Euclide để tạo ra những hình học mới là Affine và xạ ảnh, và đơn giản hóa hình học Euclide bằng cách lược bỏ bớt tiên đề, các nhà toán học của thế kỷ 19, như Lobachesky, đã giữ nguyên 4 tiên đề trước đấy của Euclide và chỉ thay thế tiên đề 5 của Euclide bằng những tiên đề đối ngược để tạo ra nhóm hình học mới, hình học phi Euclide.
Trong hình học Hyperbolic, 4 tiên đề đầu tiên của Euclide được giữ nguyên, nhưng tiên đề thứ 5 được thay bằng tiên đề sau: Với mọi đường thẳng L và điểm P không thuộc L, trong mặt phẳng chứa cả đường thẳng L và điểm P có ít nhất hai đường thẳng phân biệt qua P không cắt L.
Trong hình học Elliptic, 4 tiên đề đầu tiên của Euclide được giữ nguyên, nhưng tiên đề thứ 5 được thay bằng tiên đề sau: Với mọi đường thẳng L và điểm P không thuộc L, trong mặt phẳng chứa cả đường thẳng L và điểm P không có đường thẳng phân biệt qua P không cắt L.
Do sự thay thế tiên đề 5 bằng các trường hợp khác nhau đã tạo ra các tính chất hình học đối ngược nhau giữa 3 loại hình học Euclide, Elliptic và Hyperbolic. Từ đấy ta có rất nhiều định lý được suy ra từ ba hệ tiên đề của ba loại hình học Euclide, Elliptic và Hyperbolic sẽ hoàn toàn trái ngược nhau do chúng được suy ra từ ba hệ tiên đề trái ngược nhau: Ví dụ như tổng ba góc của một tam giác trong hình học Euclide bằng 180 độ, nhưng sẽ nhỏ hơn 180 độ trong hình học Hyperbolic và lớn hơn 180 độ trong hình học Elliptic. Như vậy Euler, Lobachesky và Reimmann đã tạo ra những hệ tiên đề khác biệt với hệ tiên đề truyền thống Euclide và tạo ra những hệ thống hình học mới với những tính chất mới trái ngược với những tính chất trong hình học Euclide.
Như vậy thông qua ví dụ trên của nhiều loại hình học dựa trên nhiều hệ tiên đề khác nhau, chúng ta hiểu sâu hơn về định lý bất toàn của Kurt Godel đã chứng minh rằng một hệ thống toán học dù phong phú đến đâu cũng không thể đầy đủ hoặc không nhất quán:
Những định lý đó của Godel vô cùng quan trọng đối với các nhà toán học vì chúng chứng minh rằng mong muốn tạo ra một tập hợp các tiên đề giải thích mọi thứ trong toán học là điều không thể. Chúng ta vẫn không thể xác định rất nhiều mệnh đề là đúng hay sai, chúng ta có thể chia chúng thành bốn trường hợp sau:
- Những mệnh đề có thể dùng suy luận logic toán học để xác định đúng hay sai
- Những mệnh đề chưa thể xác định được đúng hay sai qua a) cả suy luận logic toán học nhưng b) có thể tìm kiếm phản chứng trong một số lượng hữu hạn tính toán rất lớn mà máy tính ngày nay có thể làm được
- Những mệnh đề chưa thể xác định được đúng hay sai qua cả a) suy luận logic toán học và b) cũng chưa thể có được phản ví dụ do vượt quá khả năng tính toán của máy tính ngày nay
- Có những mệnh đề không thể xác định được đúng hay sai dù máy tính có vô hạn bộ nhớ và thời gian chạy (một ví dụ chính là bài toán Dừng nổi tiếng của Turing giúp ông phủ định thành công bài toán “vấn đề ra quyết định” của Leibniz-Hilbert)
Có rất nhiều giả thuyết toán học trong vô vàn các giả thuyết trong nhiều ngàn năm qua chưa có lời giải đáp rơi vào các trường hợp trên. Nếu các bạn quan tâm sâu hơn, chúng ta có thể tham khảo thêm theo đường dẫn [7].
Qua những ví dụ trên chúng ta nhận ra một điểm là một đặc điểm chung của toán học và khoa học máy tính là thông thường dữ liệu đầu vào của các bài toán phức tạp là rất lớn, nhiều trường hợp là vô hạn, nhưng khả năng kiểm tra dữ liệu và tính toán của cả máy tính và con người là hữu hạn. Nếu như việc kiểm tra dữ liệu và tính toán bị hạn chế, sẽ luôn có trường hợp phản ví dụ mà con người và máy tính bỏ xót, và khi bị rơi vào đúng các trường hợp bỏ xót này, con người và máy sẽ phạm sai lầm và tạo ra hệ quả khôn lường. Alan Turing và Kurt Godel đã chỉ ra một số bài toán không giải được, trong đó có bài toán không tồn tại một thuật toán chứng minh một thuật toán khác đúng hay sai. Rộng ra hơn là không tồn tại một phần mềm xác định được phần mềm khác đúng hay sai. Các bài toán lớn thường rất phức tạp và dữ liệu đầu vào vô cùng lớn, nên khi kiểm tra sẽ không thể kiểm tra được hết mọi trường hợp. Điều này lý giải vì sao máy bay vẫn có thể rơi khi phi công quá tin tưởng vào máy móc và không nhận ra sự hạn chế của trí tuệ máy đối với vô hạn đầu vào mà máy tính không thể kiểm tra được hết.
GS, TS. Vũ Đức Thi; TS. Trần Văn Tân, Bộ Thông tin và truyền thông; TS. Vũ Đức Nghĩa, Đại học Quốc gia Hà Nội