AI Agents - tác nhân trí tuệ nhân tạo sẽ định hình thế giới tương lai của chúng ta?
Kể từ sau ngày 30/11/2022 (ChatGPT phát hành công khai lần đầu tiên), AI đã càn quét cả thế giới, ở mọi lĩnh vực. Các công nghệ và mô hình mới về AI cũng liên tục ra đời, chứng tỏ sự sáng tạo vô tận của con người và sự nhạy bén vô đối của các doanh nghiệp. Nếu năm 2022 được coi là năm của các LLM (Large Language Model - Mô Hình Ngôn Ngữ Lớn với đại diện là ChatGPT), năm 2023 là năm của các compound AI system (hệ thống AI phức hợp) thì năm 2024 được gọi là năm AI agents - với sự ra đời của hàng loạt các AI agents, từ những tên tuổi đình đám làng công nghệ như Microsoft, SAP, Oracle, Salesforce… tới những startup còn non trẻ như Pixel Robotics, Bilic, Penciled, Enhans, Brance…
Không biết 2025 sẽ là năm của điều gì? AI lượng tử hay vẫn là AI agents - nhưng chắc chắn sẽ vẫn liên quan đến AI.
Có thể nói, sự thống trị chóng vánh của AI (nhờ sự phát triển nền tảng về thuật toán từ hàng chục năm trước đó và sự ra đời của những máy tính với năng lực tính toán siêu khủng trong vòng 10 năm qua) đã tạo ra một sân chơi khá công bằng cho những ý tưởng sáng tạo, thậm chí điên rồ. Công ty lớn hay một tân binh, startup non trẻ đều có thể cạnh tranh ngang ngửa nhau bằng AI.
Bài viết này sẽ bàn về AI agents - những hệ thống nổi bật trong năm 2024, được các lãnh đạo giới công nghệ coi là thứ sẽ giết chết tương lai của website và các ứng dụng.
"AI agent (tác nhân trí tuệ nhân tạo) là một hệ thống hoặc một chương trình máy tính có khả năng tự động thực hiện các tác vụ thay mặt cho người dùng hoặc thay mặt cho một hệ thống khác dựa trên việc xây dựng, thiết kế các qui trình làm việc và sử dụng các công cụ có sẵn." (định nghĩa của IBM).
AI agent có thể bao gồm một loạt các chức năng, không chỉ có xử lý ngôn ngữ tự nhiên (từ mô hình LLM), mà có thể gồm chức năng ra quyết định, giải quyết vấn đề, tương tác với môi trường bên ngoài, thực hiện các hành động.
Lõi của AI agent ngày nay vẫn là LLM. Vì thế, AI agent đôi khi được gọi là LLM agent (AI agent ngày xưa khác nha). Agent sẽ tự học cách thích ứng với kỳ vọng của người dùng theo thời gian. Khả năng lưu trữ các tương tác quá khứ và lập kế hoạch hành động trong tương lai nhằm khuyến khích trải nghiệm được cá nhân hóa và phản hồi toàn diện. AI agent không cần sự can thiệp của con người, và đang đươc mở rộng khả năng cho nhiều loại ứng dụng trong thế giới thực.
Có 5 loại AI agent, đi từ đơn giản tới phức tạp (agent đơn giản thì dành cho những mục tiêu đơn giản, để hạn chế những tính toán phức tạp không cần thiết, tiết kiệm tài nguyên):
1. Simple reflex agent (tác nhân phản xạ đơn giản): Là loại agent đơn giản nhất, chỉ hành động dựa trên nhận thức hiện tại - là một tập hợp phản xạ hoặc qui tắc. Không giữ bất kỳ bộ nhớ nào. Không tương tác với các agent khác khi thiếu thông tin. Tóm lại, agent này được lập trình sẵn để thực hiện những hành động tương ứng với các điều kiện nhất định thôi. Ngoài những cái đó thì agent “không thể phản ứng phù hợp”.
Ví dụ: bộ điều nhiệt cứ 20h là kích hoạt bật hệ thống sưởi ấm cho tòa nhà.
2. Model-based reflex agent (tác nhân phản xạ dựa trên mô hình): Agent này phản xạ dựa trên mô hình sử dụng cả nhận thức và trí nhớ hiện tại của nó. Tức nó có bộ nhớ lưu trữ và hoạt động trong môi trường quan sát/thay đổi được, nhưng vẫn bị giới hạn bởi bộ quy tắc của nó.
Ví dụ: robot hút bụi dọn dẹp phòng, cảm nhận được chướng ngại để điều chỉnh hành vi và lưu lại mô hình khu vực nó đã đi qua để không lặp lại chỗ đã dọn rồi.
3. Goal-based agent (tác nhân dựa trên mục tiêu): Agent này có một mô hình nội bộ - hay mô hình mục tiêu (một hoặc tập hợp các mục tiêu). Agent sẽ tìm kiếm các chuỗi hành động, lập kế hoạch cho các hành động, rồi tiến hành hành động theo kế hoạch để đạt được mục tiêu.
Ví dụ: hệ thống định vị đề xuất tuyến đường nhanh nhất đến điểm đến của bạn. Nó xem xét một loạt các tuyến đường khác nhau để đến đích của bạn (mục tiêu), chọn ra một tuyến ngắn nhất.
4. Utility-based agent (tác nhân dựa trên tiện ích): Agent này sẽ chọn chuỗi hành động để đạt được mục tiêu nhưng đồng thời cũng tối đa hóa tiện ích, hay phần thưởng. Tiện ích được tính bằng hàm tiện ích (gán một giá trị tiện ích - số liệu đó lường tính hữu ích hoặc chỉ số hạnh phúc - cho mỗi kịch bản theo một số tiêu chí cố định).
Ví dụ: hệ thống điều hướng đưa ra một lộ trình đường đi cho bạn nhằm tối ưu nhiên liệu, giảm thiểu thời gian chờ và tối thiểu hóa cước phí phải trả.
5. Learning agent (tác nhân học): Agent này có khả năng học hỏi. Kinh nghiệm mới được thêm vào kiến thức ban đầu một cách tự động. Nhờ đó, nó có khả năng hoạt động trong môi trường xa lạ.
Ví dụ: các đề xuất được cá nhân hóa trên các trang web thương mại điện tử. Chúng sẽ theo dõi hoạt động của người dùng, lưu lại trong bộ nhớ. Thông tin này được sử dụng để đề xuất một số sản phẩm, dịch vụ nhất định cho người dùng. Sau đó lại lưu các hoạt động người dùng để phân tích và khuyến nghị cho lần sau. Cứ thế, agent sẽ cải thiện được độ chính xác theo thời gian.
Hiện tại, các AI agent đang được dùng phổ biến ở:
- Trải nghiệm khách hàng (customer experience): AI agent được tích hợp vào website hoặc ứng dụng, như một trợ lý ảo (tư vấn bán hàng, phỏng vấn, bác sĩ kiểm tra hỗ trợ sức khỏe…), để nâng cao trải nghiệm của khách hàng.
- Chăm sóc sức khỏe: AI agent được ứng dụng nhiều trong điều trị cho bệnh nhân, quản lý thuốc, kế hoạch cấp cứu…
- Các tình huống khẩn cấp như thiên tai, lũ lụt: AI agent có thể lấy được thông tin người dùng cần giải cứu trên mạng xã hội (vị trí, tên tuổi, hồ sơ y tế…) để hỗ trợ các dịch vụ cứu hộ trong thời gian ngắn.
- Công nghệ: đây là nơi sản sinh, nhưng cũng là nơi ứng dụng phổ biến nhất của AI agent. Có vô số ý tưởng trong một năm qua được trình làng, từ agent viết code, agent quản lý dự án, agent làm test, agent quản lý qui trình… Thậm chí tôi đã thử vài agent như Replit, chỉ cần đưa ra ý tưởng về một sản phẩm, nó sẽ tự setup môi trường, viết code, chạy test, build và launch cho bạn từ A đến Z. Thế nên giờ từ luật sư tới nhân viên sales, ai cũng viết được phần mềm, các developers và testers sẽ mất việc hết, và software development sẽ bị khai tử sớm thôi.
Về mặt công nghệ, dù đều dựa trên LLM, nhưng 5 mô hình AI agent của các công ty sau hiện đang được đánh giá là mạnh nhất (dựa trên năng lực tính toán, độ phức tạp và độ chính xác):
- Agent dựa trên GPT-4o của OpenAI
- Các hệ thống tự động của Google DeepMind
- Claude của Anthropic: một agent trò chuyện có khả năng làm những tác vụ rất phức tạp trong kinh doanh, mà vẫn duy trì độ chính xác khá cao
- Alexa của Amazon
- Teneo: agent khá phổ biến trong viễn thông, chăm sóc sức khỏe, dịch vụ công, bán lẻ.
Còn trong tương lai, các AI agent được kỳ vọng sẽ chiếm chỗ ở mọi nơi, mọi lúc, thay thế luôn cả cho những hệ thống phức tạp hiện tại, thậm chí thay luôn cả con người ở nhiều vai trò.
Là dân IT, chắc bạn muốn có một mentor để cùng pair programming? Sự nổi lên nhanh chóng và thành công ngoài sức tưởng tượng của Shopify khiến công ty này gây chú ý. Shopify nổi tiếng là nơi làm việc mơ ước của các developers nhờ làm remote lương cao, và triết lý công ty 100 năm (founder luôn định hướng cho mọi ý tưởng phải đảm bảo để công ty sống sót được trong 100 năm tới), mô hình làm việc pair programming và code trong 1 giờ (nếu ý tưởng của bạn khiến bạn/hoặc đồng nghiệp của bạn code trong 1 giờ vẫn không xong, thì toàn bộ code sẽ bị xóa đi, làm lại). Pair programming nóng sốt đến độ, giờ nhiều người nghĩ AI agent sẽ làm pair programming với một developer, để code đạt tới độ hoàn hảo.
AI agent sau khi đã làm được pair programming, thì sẽ làm nốt architect, …. build và setup luôn cả hệ thống.
Thậm chí, người ta đã tưởng tượng tới người ảo.
Bạn muốn nói chuyện với Elon Musk ư? Nhưng Elon đang quá bận rộn với mấy công ty và bộ DOGE, nên ông ấy sẽ mua một AI agent, đào tạo nó một thời gian để nó bắt chước đúng tông giọng, thói quen, quan điểm (công nghệ, kinh tế, chính trị, xã hội lẫn yêu đương…) của ông ấy. Nếu ai muốn xin ông ấy tư vấn, hoặc muốn nói chuyện với Musk, họ sẽ được nói chuyện với ElonBot - mà nếu không tinh ý, có khi không phân biệt được đó là Musk thật hay bot.
Dù sao, nếu chỉ là một con người bình thường, bạn nên sớm trang bị cho mình những kỹ năng mềm như tư duy sáng tạo, năng lực thấu cảm, quản trị con người… (vì kỹ năng cứng đa số sẽ được làm bởi AI).
Thế giới đang ngày một điên rồ. Không biết ngày mai sẽ còn gì hay ho hơn nữa. Giờ chỉ có kinh ngạc và kinh ngạc hơn nữa mà thôi. Tương lai nhân loại thật đáng mong chờ.
Nhận xét
Đăng nhận xét