Thứ Ba, 6 tháng 3, 2018

Elon Musk - Kiến trúc sư của tương lai


Elon Musk – Kiến trúc sư của tương lai

Những kế hoạch thay đổi thế giới của nhà phát minh này là: sống được trong không gian, cách mạng hóa giao thông tốc độ cao, phát minh lại ô tô – và hy vọng tìm thấy tình yêu trên đường đi.


Musk tại SpaceX ở Hawthorne, California, mùa thu này. Ảnh: Mark Seliger của Rolling Stone.

Đó là vào giữa buổi chiều một ngày thứ sáu tại trụ sở chính SpaceX ở Hawthorne, California, ba người con của Elon Musk đang tụ tập quanh anh – một trong cặp sinh ba và hai đứa trẻ sinh đôi.

Musk mặc chiếc áo thun màu xám và ngồi trên chiếc ghế xoay ở bàn làm việc, không phải là một phòng riêng sau cánh cửa đóng kín, mà là một căn góc gần gũi ai cũng có thể tới lui, được trang trí với những vật phẩm về không gian vũ trụ, các bức ảnh tên lửa, những vật lưu niệm từ Tesla và các công ty khác của anh.


Elon Musk chụp ở Hawthorne, California, ngày 5 tháng 10, 2017. Ảnh Mark Seliger chụp cho Rolling Stone.

Hầu hết mọi người đều nói, có một poster chân dung của một ngôi sao mới nổi với tiêu đề bên dưới viết rằng: “Khi bạn ước dưới một vì sao đang rơi, những giấc mơ của bạn có thể thành sự thật. Nhưng khi đó thực ra là một thiên thạch đang đâm xuống Trái đất phá hủy toàn bộ sự sống. Thế là bạn sẽ bị lừa, bất kể bạn ước cái gì. Trừ việc muốn chết do thiên thạch.” Đối với hầu hết mọi người, chuyện này có lẽ chỉ là màn hài hước đen tối, nhưng trong bối cảnh này, nó cũng là lời nhắc nhở về kế hoạch lớn của Musk: tạo ra môi trường sống cho nhân loại trên các hành tinh và mặt trăng khác. Nếu chúng ta không đưa nền văn minh tiến vào Kỷ Nguyên Tăm Tối (Dark Ages) trước khi Musk hay một trong những người kế thừa giấc mơ của anh kéo nó vào, thì Musk có lẽ sẽ được nhớ tới như là một trong những nhân vật có ảnh hưởng nhất trong thiên niên kỷ này. Trẻ em trên tất cả những hành tinh tương đồng với Trái Đất trong vũ trụ sẽ trông đợi tới Musk Day (ngày của Musk), khi chúng được nghỉ để kỷ niệm ngày sinh của một nhân vật từ Trái đất, người đã một mình một tay mở ra kỷ nguyên thuộc địa hóa vũ trụ.

Và đó chỉ là một trong các tham vọng của Musk. Những tham vọng khác còn có cả chuyển đổi ô tô, hộ gia đình và càng nhiều ngành công nghiệp càng tốt từ việc dùng nhiên liệu hóa thạch sang năng lượng bền vững; triển khai một hình thức vận chuyển cao tốc mới từ thành phố này sang thành phố khác qua các ống chân không; giảm bớt tắc nghẽn giao thông bằng một tổ ong chứa các đường hầm dưới lòng đất trang bị thiết bị trượt điện cho xe ô tô và người đi làm; tạo ra một giao diện trí tuệ – máy tính để cải thiện sức khỏe và trí não con người; cứu nhân loại khỏi nguy cơ trong tương lai đến từ trí tuệ nhân tạo – thứ mà một ngày nào đó sẽ trở nên điên cuồng rồi quyết định (một cách rất hợp lý) rằng phải loại bỏ giống loài phi logic như loài người đi.

Cho đến nay, Musk, 46 tuổi, vẫn chưa hoàn thành được bất kỳ cái nào trong những mục tiêu trên.

Nhưng những gì anh đã và đang làm lại khiến rất ít người đang sống có thể đòi hỏi: cày ủi chăm chỉ, dù không có bất kỳ kinh nghiệm nào, trong 2 lĩnh vực có nhiều rào cản cao tới mức khó tin để bước vào – đó là sản xuất ô tô (Tesla) và tên lửa (SpaceX) – rồi tạo ra những sản phẩm tốt nhất trong những ngành công nghiệp này, dù được đo bằng bất cứ thước đo có nghĩa nào mà bạn có thể nghĩ tới. Trong quá trình này, anh đã xoay sở để bán cho thế giới khả năng đạt được mục tiêu cao cả tới mức, nếu từ miệng của bất kỳ ai khác, họ sẽ gọi điều đó là không tưởng.

Ít nhất là với hầu hết mọi người trên thế gian. “Tôi đang nhìn vào những tổn thất trong ngắn hạn.” Musk nói, bị gián đoạn bởi CNBC trên chiếc iPhone của anh. Anh nói chuyện với các con của mình mà không ngước lên. “Này các chàng trai, hãy kiểm tra cái này: Tesla có vị trí ngắn hạn cao nhất trên toàn bộ thị trường chứng khoán. Một vị trí ngắn hạn $9 tỷ.”

Những đứa trẻ nghiêng đầu nhìn vào điện thoại, một bảng đầy các con số mà tôi không hiểu. Vì thế, Griffin, cậu bé 13 tuổi, giải thích cho tôi: “Họ đang cược rằng chứng khoán sẽ giảm, và họ đang thu được tiền. Nhưng khi nó lên cao, họ sẽ mất một số tiền khủng.”

Musk nói: “Họ là lũ cá mập muốn chúng tôi chết đi. Họ liên tục tạo ra tin đồn giả và khuếch đại bất cứ tin tiêu cực nào. Đó thực sự là một sự khiêu khích lớn khi nói dối và tấn công tính ngay thẳng của tôi. Điều đó thực kinh khủng. Nó thật…”

Anh bỏ lửng câu nói ở đó, như thường làm khi bị một suy nghĩ nào đó chiếm giữ. Tôi cố giúp: “Vô đạo đức?”

“Nó thật…” Anh lắc đầu và đấu tranh tìm một từ đúng, rồi nhẹ nhàng nói “Đau lòng.”

Rất dễ nhầm lẫn một người là ai với những gì họ làm, và thế là biến chúng thành một nhân vật biếm họa phù hợp gọn ghẽ với quan điểm sách vở của cả thế giới. Nền văn hóa của chúng ta luôn cần những nhân vật phản diện và các anh hùng, những kẻ ngu ngốc và thiên tài, những con dê tế thần và những người mẫu nhập vai. Tuy nhiên, bất chấp những ý kiến trái chiều, Elon Musk không phải là robot được gửi từ tương lai tới cứu rỗi nhân loại. Anh cũng không phải là một thiên tài có hiệu ứng cảm xúc được thay thế bằng trí tuệ như siêu máy tính. Trong suốt 9 tháng báo cáo, quan sát Musk làm mọi thứ từ chiến lược hạ cánh trên Sao Hỏa với đội ngũ kỹ thuật tên lửa tới việc lên kế hoạch cho những đột phá kế tiếp cùng các chuyên gia trí tuệ nhân tạo của anh, tôi học được rằng, anh ấy là một người khác rất, rất xa những gì mà huyền thoại và danh tiếng của anh khiến chúng ta tưởng tượng ra.

Tờ New York Times gọi anh là “một doanh nhân thành công và quan trọng nhất thế giới”. Chuyện này rất dễ hiểu: Anh có lẽ là người duy nhất gây dựng 4 công ty tỷ đô – PayPal, Tesla, SpaceX và Solar City. Nhưng cốt lõi là anh ấy không phải là một doanh nhân. Anh ấy là một kỹ sư, một nhà phát minh, và như anh tự nhận, “một nhà công nghệ”. Giống như một kỹ sư có năng khiếu tự nhiên, anh có thể tìm được những thiếu sót trong thiết kế, các lỗ hổng và cả những điều phóng đại quá mức trong các công cụ đang chi phối nền văn minh của chúng ta.

“Anh ấy có thể nhìn thấy mọi thứ rõ ràng hơn theo cách mà không ai khác ngoài tôi có thể hiểu.” Em trai Kimbal của anh nói. Kimbal nói về tình yêu của anh trai với cờ vua trong những năm đầu đời, và cho biết thêm rằng: “Có một thứ trong cờ vua, nếu bạn nhìn trước được 12 nước đi thì bạn là bậc thầy. Và trong bất kỳ hoàn cảnh cụ thể nào, Elon đều có thể nhìn trước 12 nước.”


Getty

Các con của anh nhanh chóng ra về với mẹ chúng, Justine – vợ cũ của Musk. “Tôi ước chúng tôi có thể vẫn là công ty tư nhân với Tesla.” – Musk nói khẽ khi bọn trẻ vừa rời khỏi. “Trở thành công ty đại chúng thực sự khiến chúng tôi kém hiệu quả.”

Theo sau đó là … im lặng. Musk ngồi trên bàn làm việc, nhìn vào điện thoại, nhưng không gõ hay đọc gì. Rồi anh tự cúi người xuống sàn, thư giãn lưng trên một con lăn mát xa. Sau khi xong, tôi bắt đầu cuộc phỏng vấn bằng cách hỏi về Model 3 của Tesla vừa ra mắt 1 tuần trước, và cảm giác lúc đó như thể đang đứng trên sân khấu và nói với thế giới rằng anh mới chỉ thành công bước đầu trong một kế hoạch 14 năm vẫn đang trong quá trình thực hiện: khởi động những chiếc ô tô điện xa xỉ, và một chiếc xe điện trên thị trường đại chúng.

Đối với Musk, thành tựu này không chỉ là sản xuất một chiếc xe điện 35.000 đô, mà trong quá trình sản xuất chiếc xe điện $35.000, việc đó hay ho và cần thiết đến mức khiến các nhà sản xuất ô tô khác phải ngưng xe chạy gas để lao vào cạnh tranh. Chắc chắn rồi, trong vòng 2 tháng kể từ khi ra mắt, cả GM lẫn Jaguar Land Rover đều thông báo họ cũng đã lên kế hoạch loại bỏ ô tô chạy gas để chuyển sang chạy hoàn toàn bằng điện.

Musk nghĩ một lúc, bắt đầu trả lời, rồi lại dừng lại. “Ừm, thực ra, hãy để tôi đi vệ sinh đã. Sau đó tôi sẽ đề nghị anh lặp lại câu hỏi đó.” Dừng lâu hơn một chút. “Tôi cũng phải dỡ bỏ những thứ khác trong đầu tôi.”

5 phút sau, Musk vẫn không quay lại. Sam Teller, Chánh văn phòng của anh ấy, nói: “Tôi sẽ quay lại ngay.”

Vài phút sau, cả hai lại xuất hiện và hơi vội vàng, đang thì thầm với nhau. Sau đó Musk trở lại bàn làm việc.

Tôi đề nghị: “Chúng ta có thể đặt lịch lại vào một ngày khác nếu lúc này là một thời điểm xấu.”
Musk đan tay đặt trên mặt bàn, tự giễu và từ chối.
“Có lẽ tôi mất chút thời gian để đưa mọi thứ vào đúng nhịp điệu.”

Sau đó anh thở dài và kết thúc nỗ lực trong sự bình tĩnh. Anh do dự nói: “Tôi vừa mới chia tay bạn gái. Tôi đã thực sự yêu, và nó làm tôi tổn thương theo hướng thật tệ.”

Anh dừng một lúc rồi tự sửa lại: “Ồ, cô ấy chia tay với tôi hơn là tôi chia tay với cô ấy, tôi nghĩ thế.”

Rồi trả lời cho câu hỏi trước đó: Thật ngạc nhiên, thất vọng và kinh khủng đến mức không thể kiểm soát nổi khi ra mắt Model 3. Musk giải thích: “Tôi đã trải qua nỗi đau tình cảm trầm trọng trong vài tuần gần đây. Trầm trọng. Cần mọi ounce ý chí để có thể làm sự kiện Model 3 và không được trông giống như những anh chàng tuyệt vọng nhất xung quanh. Suốt những ngày đó, tôi phát bệnh. Rồi tôi phải tự nâng tinh thần lên: uống vài cốc Red Bulls, đi chơi với những người tích cực và sau đó, tự nói với mình: ‘Tất cả những con người này đang phụ thuộc vào mình. Được rồi, làm đi thôi!”

Vài phút trước sự kiện, sau khi ngồi thiền lần đầu tiên trong đời để tập trung, Musk chọn một bài hát rất đáng nói để lèo lái sân khấu: “R U Mine?” (Em là của tôi ư?) của Arctic Monkeys.

Musk nói về việc chia tay thêm vài phút nữa, sau đó nghiêm túc hỏi với vẻ mặt ngây ra bất động: “Có ai đó anh nghĩ tôi có thể hẹn hò không? Đối với tôi, gặp gỡ mọi người thật khó khăn.” Anh nuốt nước bọt và nhẹ nhàng nói: “Tôi đang tìm một mối quan hệ lâu dài. Tôi không tìm tình một đêm. Tôi đang tìm một người đồng hành nghiêm túc hay một người tri kỷ, kiểu thế đó.”

Cuối cùng, tôi bảo anh ấy, có lẽ không phải ý hay khi nhảy ngay vào một mối quan hệ khác. Anh ấy có lẽ cần một chút thời gian cho bản thân và tìm hiểu lý do tại sao các mối quan hệ trước đây của anh ấy đều không kéo dài: cuộc hôn nhân với nhà văn Justine Musk, cuộc hôn nhân với diễn viên Talulah Riley, và cuộc tình tan vỡ mới nhất với nữ diễn viên Amber Heard.

Musk lắc đầu và nhăn mặt: “Nếu tôi không yêu, nếu tôi không có bạn đồng hành lâu dài, tôi không thể hạnh phúc.”

Tôi giải thích rằng việc cần ai đó tệ tới mức bạn cảm thấy chả làm được gì nếu không có họ chỉ là sự phụ thuộc lẫn nhau diễn ra trong sách vở.
Musk không đồng ý. Rất mạnh mẽ. “Không đúng.” Anh hăng hái đáp lại. “Tôi sẽ không bao giờ hạnh phúc mà không có ai đó. Đi ngủ một mình sẽ giết chết tôi.” Anh ấy do dự, lắc đầu, nhún vai rồi tiếp tục. “Không phải là tôi không biết cảm giác đó thế nào: Một mình trong căn nhà lớn trống rỗng, và những bước chân lướt qua hành lang, không ai ở đó cả - không ai bên gối cạnh bạn. Chết tiệt. Làm sao anh có thể khiến bản thân hạnh phúc trong hoàn cảnh như thế?”

Những điều Musk đang nói là sự thật. Ở trên đỉnh rất cô đơn. Nhưng không phải mọi người đều thế. Ở trên đỉnh chỉ có cảm giác cô đơn với những ai vốn dĩ đã cô đơn từ lúc còn ở dưới đáy.

Musk tiếp tục: “Khi tôi là một đứa trẻ, tôi từng nói một điều.” Thái độ của anh trở nên cứng rắn, nhưng trong ánh sáng chiếu lại từ đôi mắt và sự run rẩy của đôi môi, có thể nhìn thấy cơn triều dâng cao của cảm xúc, đẩy ngược lại những bức tường. “’Tôi không bao giờ muốn đơn độc.’ Đó là những gì tôi muốn nói.” Giọng anh lại như thì thầm. “Tôi không muốn đơn độc.”

Một vòng màu đỏ hình thành quanh mắt anh khi anh nhìn chằm chằm về phía trước và ngồi bất động trong tĩnh lặng. Musk là Titan, là một người nhìn xa trông rộng, một đòn bẩy kích cỡ con người thúc đẩy đám đông hướng tới những thứ không thể tránh khỏi của lịch sử - loại người này chỉ xuất hiện vài lần trong một thế kỷ - nhưng lúc này, anh ấy dường như chỉ là một đứa trẻ sợ bị bỏ rơi. Và đó có thể là nguồn gốc cho các siêu tham vọng của Musk, nhưng nói thêm về điều đó sau. Giờ Musk có vài thứ muốn chỉ cho tôi.

“Nếu anh nói bất cứ điều gì về những gì anh sắp nhìn thấy, nó có thể làm chúng tôi mất hàng tỷ đô la”, anh nói, rồi đứng dậy khỏi bàn làm việc. “Và anh sẽ bị tống vào tù.”

Điểm thu hút khách du lịch nhất ở hạt Los Angeles là điểm không có trong nhiều sách hướng dẫn du lịch: Nó nằm ở thành phố tây nam Hawthorne không có dịch vụ tham quan, gần SpaceX. Nếu bạn đi dọc theo đại lộ Crenshaw, từ đại lộ Jack Northrop tới đường thứ 120, những gì bạn nhìn thấy là một thành phố của tương lai đang trong quá trình xây dựng. Đó là thành phố của Musk, một thực tế thay thế, một thành công của trí tưởng tượng tương lai li kỳ hơn bất kỳ thứ gì ở công viên Disney. Phía tây con đường, các tháp tên lửa cao 156 foot mọc trên trụ sở chính của SpaceX, tượng trưng cho giấc mơ của Musk về các chuyến du hành vũ trụ chi phí tương đối thấp. Động cơ tăng cường tên lửa đặc biệt này lần đầu tiên trong lịch sử loài người được phóng lên không gian, sau đó phục hồi nguyên vẹn trên Trái Đất sau khi tách ra, rồi sau lại được phóng trở lại vào không gian. Phía đông con đường, một bãi đỗ xe của nhân viên đã bị đào lên và biến thành đường hầm đầu tiên của công ty Boring, trong giải pháp tổ ong ngầm của Musk để kiềm chế ùn tắc giao thông và là ngôi nhà tương lai của tất cả các dự án giao thông trên bộ của anh. Kế tiếp, cách đại lộ Jack Northrop một dặm, có một ống chân không màu trắng dọc theo con đường. Đây là nơi thử nghiệm Hyperloop – một hình thức đi lại tốc độ cao từ thành phố này sang thành phố khác của Musk. Khi được kết hợp lại, những giấc mơ của thành phố Musk hứa hẹn sẽ kết nối hành tinh này với hệ mặt trời theo những cách thức làm thay đổi căn bản mối quan hệ của con người với hai trong số những khía cạnh quan trọng nhất của hiện thực: khoảng cách và thời gian.

Nhưng có một tòa nhà đặc biệt trong thành phố Musk mà rất ít người viếng thăm, và đây là nơi Musk dẫn tôi tới. Đó là Tesla Design Studio, nơi anh dự kiến làm một số kiểm tra đánh giá cho xe tải Tesla cùng các bản mẫu của các phương tiện giao thông tương lai khác với nhóm thiết kế và các kỹ sư.

Ngoài cửa, một bảo vệ thu điện thoại và máy ghi âm của tôi, tôi được đưa cho một cây bút kiểu cũ cùng giấy để ghi chép. Musk tiếp tục đi vào tòa nhà và hé lộ về xe tải Tesla, chiếc xe giúp ngành công nghiệp xe tải hướng tới sự thân thiện với môi trường. (Musk thậm chí còn đang chơi đùa khi tạo ra chiếc máy bay phản lực siêu âm, cất cánh hạ cánh thẳng đứng, trong tương lai.) Bốn thành viên chủ chốt của đội Tesla đều ở đó – Doug Field, JB Straubel, Franz von Holzhausen, Jerome Guillen – và thận trọng theo dõi khi Musk lần đầu khám phá cấu hình mới của một chiếc xe chở khách.

Guillen giải thích ý tưởng ẩn sau chiếc xe: “Chúng tôi chỉ nghĩ ‘Người ta muốn gì? Họ muốn sự tin cậy. Họ muốn chi phí thấp nhất. Và họ muốn lái xe thoải mái.’ Vì thế chúng tôi thiết kế lại chiếc xe tải.”

-------------

Đây là một ví dụ hoàn hảo cho ý kiến nói rằng những người nhìn xa trông rộng được Musk truyền cảm hứng trên khắp thế giới đang tôn thờ điều này như một tôn giáo: nghĩ về những nguyên tắc đầu tiên. Nói cách khác, nếu bạn muốn sáng tạo hoặc đổi mới, hãy bắt đầu từ một tờ giấy trắng sạch sẽ. Đừng chấp nhận bất kỳ ý tưởng, thực tế hay tiêu chuẩn nào chỉ vì những người khác đang làm thế. Ví dụ, nếu bạn muốn tạo một chiếc xe tải, nó phải có khả năng vận chuyển hàng hóa tin cậy từ nơi này sang nơi khác, và bạn phải tuân theo các qui luật vật lý hiện hữu. Mọi thứ khác đều có thể thương lượng, kể cả các qui định của chính phủ. Nhớ rằng mục tiêu không phải là phát minh lại chiếc xe tải, mà là tạo ra chiếc tốt nhất, dù nó có giống hay không với những chiếc xe tải khác trong quá khứ.

Kết quả với cách suy nghĩ này là, Musk có thể nhìn một ngành công nghiệp khách quan hơn nhiều so với những người đã ở trong lĩnh vực đó cả đời.

Musk nói về những ngày đầu của Tesla: “Tôi từng bị bảo rằng, việc này là bất khả thi và tôi là một kẻ dối trá lớn. Nhưng tôi có một chiếc xe và anh có thể lái nó. Nó không giống như con kỳ lân đang bay lượn. Thật đấy. Lái đi. Rất thú vị. Làm sao anh có thể từ chối được kia chứ?”

Một thực tế không may trong bản chất con người là khi người ta ra quyết định về một điều gì đó, họ không có xu hướng thay đổi nó – ngay cả khi phải đối mặt với sự thật ngược lại. Musk nói: “Điều đó rất phản khoa học. Có một thứ, gọi là vật lý – đó là phương pháp khoa học rất hiệu quả để tìm ra sự thật.”

Phương pháp khoa học là cụm từ Musk thường dùng khi được hỏi làm cách nào anh đi tới một ý tưởng, giải quyết một vấn đề hay lựa chọn bắt đầu một việc kinh doanh. Đây là cách anh định nghĩa nó theo ý riêng của mình:
1.      Đặt một câu hỏi.
2.      Thu thập càng nhiều bằng chứng càng tốt về nó.
3.      Phát triển các tiên đề dựa trên bằng chứng, rồi thử gán xác suất của sự thật cho mỗi cái.
4.      Vẽ ra một kết luận dựa trên tính xác thực để ra quyết định: các tiên đề này có đúng không, chúng có phù hợp không, chúng có cần thiết để dẫn tới kết luận này không, và với xác suất là bao nhiêu?
5.      Cố gắng bác bỏ kết luận. Tìm kiếm những bác bỏ từ người khác để giúp phá vỡ kết luận của bạn ở mức độ sâu hơn.
6.      Nếu không ai có thể bác bỏ được kết luận của bạn, thế thì có lẽ bạn đúng, nhưng bạn không chắc chắn đúng.

Musk kết luận: “Đó là phương pháp khoa học. Nó thực sự hữu ích để tìm ra những tiểu xảo. Nhưng hầu hết mọi người không dùng nó. Họ chỉ dùng cách tư duy theo mong muốn. Họ bỏ qua các giải pháp đối lập. Họ tạo dựng các kết luận dựa trên những gì người khác đang làm hoặc không làm. Lý do là ‘Nó đúng vì tôi đã nói nó đúng’ chứ không phải vì nó vốn dĩ đúng theo qui luật khách quan.

Musk giải thích bằng giọng nhát ngừng và lắp của anh: “Mục tiêu cơ bản của Tesla, ít nhất là động cơ của tôi, là đẩy nhanh sự ra đời của năng lượng bền vững. Đó là lý do tại sao tôi cho công khai các bằng phát minh. Đó là cách duy nhất để chuyển sang dùng năng lượng bền vững tốt hơn.
Thay đổi khí hậu là mối đe dọa lớn nhất con người đang đối mặt trong thế kỷ này, trừ với AI. Nhưng tôi vẫn cứ tiếp tục nói với mọi người điều này. Tôi ghét trở thành nàng Cassandra ở đây, nhưng thật nực cười, tất cả như diễn trò cho tới khi ai đó mắt nhắm mắt mở thôi đi. Quan điểm này (về thay đổi khí hậu) đã được hầu hết những ai không điên cuồng trong cộng đồng khoa học chia sẻ.”

20 phút tiếp theo, Musk kiểm tra xe tải Tesla. Trước hết anh bình luận về các chi tiết kỹ thuật, kể cả những việc nhỏ như các hạn chế và lợi ích của các kiểu hàn khác nhau. Rồi anh chuyển sang thiết kế, đặc biệt với tính năng lái xe thoải mái không được làm rõ ra ở đây, vì thời gian bị giam hãm gây nhiều nguy cơ.

Anh nói với đội ngũ của mình: “Có thể không ai mua nó vì điều này. Nhưng nếu các bạn sắp tạo một sản phẩm, hãy làm nó thật đẹp. Ngay cả khi nó không ảnh hưởng đến việc bán hàng, tôi vẫn muốn nó phải đẹp.”


Musk lúc 8 tuổi. Sự nhã nhặn lịch sự của Elon Musk.

Theo phán đoán tốt nhất của Musk, đặc điểm tự thân mỗi chúng ta có khoảng 80% là tự nhiên và 20% do nuôi dưỡng. Dù tỉ lệ này thực sự là bao nhiêu đi chăng nữa, nếu bạn muốn hiểu được tương lai Musk đang xây dựng, quan trọng vẫn phải hiểu được quá khứ đã xây dựng nên anh ấy, trong đó có cả nỗi sợ hãi của anh về sự tuyệt chủng của nhân loại và sự cô đơn.

8 năm đầu đời, Musk sống với mẹ mình, Maye, một người ăn kiêng và là người mẫu, cùng cha mình, Errol, một kỹ sư, ở Pretoria, Nam Phi. Anh hiếm khi nhìn thấy họ.

Musk nhớ lại: “Tôi thực ra không có một vú em hay thứ gì đó. Tôi chỉ có một người giúp việc ở đó để đảm bảo tôi không phá vỡ cái gì. Bà ấy không phải, giống như kiểu, để trông nom tôi. Tôi đã tạo chất nổ và đọc sách, rồi xây dựng tên lửa và làm những việc có thể khiến mình bị giết chết. Tôi rất kinh ngạc khi giờ tôi vẫn có đủ các ngón tay.” Anh giơ bàn tay và kiểm tra chúng, đọc các con số giảm dần. “Tôi được lớn lên từ sách. Sách, và sau đó là bố mẹ tôi.”

------------------

Một số cuốn sách sẽ giúp ta giải thích được thế giới Musk đang xây dựng, đặc biệt loạt sách Kiến tạo của Issac Asimov. Những quyển sách này tập trung vào công việc của một người có tầm nhìn xa trông rộng tên là Hari Seldon, người đã phát minh ra một phương pháp khoa học để tiên đoán tương lai dựa trên hành vi của đám đông. Ông nhìn thấy Kỷ Nguyên Tăm Tối (Dark Ages) kéo dài 30.000 năm đang chờ đợi nhân loại, và tạo ra một kế hoạch gửi các cột trụ khoa học tới các hành tinh xa xôi để giúp nền văn minh giảm thiểu hậu quả của thảm họa không thể tránh khỏi này.

Musk giải thích: “Asimov tất nhiên có ảnh hưởng vì ông ta song hành với Sự Suy Tàn và Sụp Đổ của Đế quốc La Mã (Gibbon), nhưng ông đã áp dụng điều đó cho một loại hình đế quốc hiện đại trong vũ trụ. Bài học tôi rút ra từ đó là, bạn nên thử một chuỗi hành động có thể kéo dài nền văn minh, tối thiểu hóa khả năng xảy ra kỷ nguyên tối tăm và giảm độ dài thời gian của kỷ nguyên đen tối ấy nếu nó xảy ra.”

Musk lúc đó khoảng 10 tuổi, và rơi vào kỷ nguyên tối tăm của bản thân anh. Rồi anh có một động thái làm thay đổi cuộc đời. Đó là một quyết định sai lầm đến đúng lúc.

Khi bố mẹ chia tay 2 năm trước, anh và cặp em trai song sinh của mình – Kimbal và Tosca - ở lại với mẹ. Nhưng Musk kể lại: “Tôi cảm thấy có lỗi với cha tôi, vì mẹ tôi có cả ba đứa con. Ông dường như rất buồn và cô độc. Vì thế tôi nghĩ ‘Mình có thể làm bạn đồng hành.’” Anh dừng lại khi những thước phim giá trị vẫn đang như rung động trong tâm trí.

“Phải, tôi thấy buồn cho cha mình. Nhưng lúc đó tôi không thực sự hiểu được ông ấy là loại người gì.”

Anh thở dài buồn bã, rồi thẳng thắn nói về việc chuyển đến với bố. “Đó không phải là ý hay.”

Theo Elon, cha anh, Errol, có chỉ số IQ cực kỳ cao – “thiên tài trong kỹ thuật, thiên tài” – và được cho là người trẻ nhất có chứng chỉ kỹ sư chuyên nghiệp ở Nam Phi. Khi Elon đến sống với cha ở Lone Hill, ngoại ô Johannesburg, Errol đang tự mình kiếm tiền trong những thế giới đầy hiểm nguy của ngành xây dựng và khai thác ngọc lục bảo – nhiều lần ông ấy nói không thể đóng cửa an toàn.

Musk nói: “Tôi tự nhiên giỏi về kỹ thuật vì thừa hưởng từ cha tôi. Những thứ rất khó với người khác lại dễ dàng với tôi. Có khoảng thời gian, tôi đã nghĩ mọi thứ rõ ràng nên mọi người đều phải biết.”

Giống như thứ gì nhỉ?

“Vâng, giống như cách đi dây trong một ngôi nhà. Rồi bảng mạch, dòng điện xoay chiều, dòng một chiều, amp là gì và volt là gì, làm sao trộn một nhiên liệu và các chất oxy hóa để tạo ra một chất nổ. Tôi nghĩ mọi người đều biết.”

Nhưng có một khía cạnh khác với cha của Musk, cũng rất quan trọng, đã làm Elon trở thành con người như bây giờ. Musk chia sẻ: “Ông ấy là một con người khủng khiếp. Anh chả nghĩ ra nổi đâu.” Giọng anh run rẩy, anh nói một chút về điều đó, nhưng không đi vào chi tiết. “Bố tôi có một kế hoạch xấu xa được suy tính kỹ lưỡng. Ông ấy sẽ làm điều xấu.”
Ngoài việc lạm dụng tình cảm, điều đó có gồm cả làm dụng thể xác không?
“Bố tôi không bạo lực tôi về mặt thể xác. Ông chỉ bạo hành thể xác khi tôi còn rất trẻ.” (Errol đã trả lời qua email rằng ông chỉ “đánh” Elon một lần, “ở phía dưới.”)

Đôi mắt Elon đỏ lên khi anh tiếp tục nói về bố mình. “Anh không biết nó tệ thế nào đâu. Hầu như mọi tội ác anh có thể nghĩ tới, ông ấy đều đã làm. Hầu như mọi điều xấu xa anh có thể nghĩ tới, ông ấy đều đã làm. Ừm…”

Rõ ràng có điều gì đó Musk muốn chia sẻ, nhưng anh không thể tự nói ra thành lời, ít nhất không có trong ghi âm. “Thật kinh khủng, anh không thể tin nổi đâu.”
Những giọt nước mắt lặng lẽ chảy xuống trên gương mặt anh. “Tôi không thể nhớ lần cuối cùng tôi đã khóc.” Anh quay sang Teller để xác nhận điều này. “Ông chưa bao giờ nhìn thấy tôi khóc.”
Teller nói: “Không. Tôi chưa bao giờ nhìn thấy anh khóc.”
Dòng nước mắt dừng lại nhanh như lúc nó xuất hiện. Và một lần nữa, Musk mang khuôn mặt lạnh lùng, ngây thơ, nhưng có vẻ gai góc nhẹ nhàng, vốn dĩ quen thuộc hơn với thế giới bên ngoài.

Tuy nhiên, rõ ràng bây giờ đó không phải là gương mặt của ai đó vô cảm, mà là của người mang rất nhiều cảm xúc bị buộc phải đè nén lại để sống sót qua một tuổi thơ đầy đau đớn.

Khi được hỏi về những tội lỗi kia, cha của Musk đã nói rằng ông chưa bao giờ cố ý đe dọa hoặc gây tổn thương cho bất kỳ ai, hoặc phải chịu trách nhiệm về bất cứ tội nào, ngoại trừ… có một lần, ông nói mình đã nổ súng giết ba trong số năm hay sáu người có vũ trang đột nhập vào nhà, và sau đó đã được xóa bỏ mọi trách nhiệm vì lý do tự vệ.

Trong email, Errol viết: “Tôi đã bị buộc tội là Tên Đồng Tính, Kẻ Ghét Phụ Nữ, Kẻ Ấu Dâm, Kẻ Phản Bội, Một Con Chuột, một Kẻ Thối Tha (rất thường xuyên), một Tên Khốn (vì nhiều phụ nữ tôi đã quyến rũ nhưng bỏ rơi) và rất nhiều nữa. Người mẹ (tuyệt vời) của tôi nói với tôi rằng tôi là kẻ “vô tình” và nên học cách trở nên “con người” hơn.” Nhưng ông ấy kết luận: “Tôi yêu các con mình và sẵn sàng làm bất kỳ điều gì cho chúng.”

------------

Khi trưởng thành, Musk, với niềm lạc quan như khi anh chuyển tới sống với bố hồi còn nhỏ, đã rời bỏ bố mình, vợ sau và những đứa con của họ, để tới Malibu. Anh sau này đã mua cho họ một căn nhà, những chiếc xe hơi và một con thuyền. Nhưng Elon nói bố anh không hề thay đổi, và Elon đã chấm dứt mối quan hệ.

Anh nói về bài học cuối cùng mình thu được, đó là cha anh sẽ không bao giờ thay đổi. “Theo kinh nghiệm của tôi, bạn chả thể làm gì được. Không gì, không gì hết. Tôi cầu mong. Tôi thử mọi cách. Tôi thử đe dọa, tặng thưởng, tranh luận về lý, về tình, mọi thứ để cố thay đổi cha tôi theo hướng tốt hơn, nhưng không có cách nào thành công, mọi thứ chỉ tệ hơn.”

Nơi nào đó trong mối ràng buộc đầy đau thương này là chìa khóa cho thế giới quan của Musk – sáng tạo chống lại sự hủy diệt, có ích chống lại có hại, bảo vệ thế giới trước cái ác.

Mọi thứ ở trường cũng không tốt hơn nhiều so với cuộc sống ở nhà. Ở đó Musk bị bắt nạt tàn nhẫn – cho tới khi anh 15 tuổi.

“Đó là khoảng thời gian dài nhất, tôi là đứa nhỏ tuổi nhất và bé nhất lớp vì ngày sinh của tôi rơi gần như vào ngày cuối cùng người ta chấp nhận bạn vào học, ngày 28 tháng 6. Và tôi là cái cây ra hoa muộn. Vì thế tôi thành đứa nhỏ tuổi nhất và bé nhất suốt nhiều năm liền… Mọi đứa ở trường đều có thể đánh đuổi tôi – thật sự chúng đã đánh đuổi tôi.”

Khi anh đánh nhau với tên khốn lớn nhất trường và hạ hắn bằng một cú đấm, Musk nhận thấy tên kia không bao giờ bắt nạt anh nữa. Musk mạnh mẽ nói: “Điều đó dạy tôi một bài học: Nếu bạn đánh nhau với một tên khốn, bạn không thể nhẹ tay với hắn. Bạn đấm vào mũi hắn. Những tên khốn chỉ tìm các mục tiêu không biết đánh lại chúng. Nếu bạn tự biến mình thành một mục tiêu khó nhằn và đấm vào mũi tên khốn đó, hắn sẽ đánh bạn nhừ tử, nhưng sau đó hắn sẽ không đánh bạn nữa.”

Khi 17 tuổi, Musk rời trường đại học và chuyển tới quê mẹ, Canada, sau đó lấy hộ chiếu cho mẹ, em trai và em gái anh trở về cùng anh ở đó. Cha anh không mong họ mọi chuyện tốt lành, Musk nhớ lại: “Ông ấy cay độc nói rằng tôi sẽ trở lại chỉ sau ba tháng thôi, rằng tôi sẽ không bao giờ làm được chuyện đó, rằng tôi sẽ không bao giờ tự làm được cái gì hết. Ông luôn gọi tôi là thằng ngốc. Nói cách khác, đó chỉ là phần nổi của tảng băng trôi.”


Năm 1998, Elon Musk thành lập PayPal cùng Peter Thiel. (Từ Paul Sakuma/AP)

Sau khi Musk thành công, bố anh vẫn cho rằng mình có công giúp đỡ anh – tới mức chuyện này được kể lại trong tiểu sử trên Wikipedia của Elon. “Một việc ông ấy tuyên bố là ông ấy đã cho chúng tôi toàn bộ tiền, em trai tôi và tôi, để bắt đầu gây dựng công ty đầu tiên của chúng tôi [Zip2, phần mềm cung cấp các chỉ dẫn trực tuyến trong thành phố]. Musk nói: “Điều đó không đúng. Ông ấy không liên quan gì. Ông ấy không trả gì cho việc học đại học. Em trai và tôi trả phí học đại học bằng học bổng, vay nợ và làm hai công việc cùng một lúc. Khoản tiền chúng tôi có để lập công ty đầu tiên đến từ một nhóm nhỏ các nhà đầu tư thiên thần ngẫu nhiên ở Thung Lũng Silicon.”

Câu chuyện sự nghiệp của Musk được trang trí đầy trên bàn làm việc của anh. Hầu như đều có một đồ vật từ mỗi công ty của anh sáng lập, kể cả một chiếc cốc từ X.com, ngân hàng trực tuyến ban đầu anh thành lập, sau này trở thành PayPal. Bán Zip2 được $22 triệu đô vào túi Musk, anh đã dùng một phần để lập X.com. Với khoản tiền khoảng $180 triệu đô sau thuế kiếm được từ bán PayPal, anh tiếp tục thành lập SpaceX với $100 triệu đô, còn $70 triệu đô đầu tư vào Tesla, $10 triệu vào Solar City, và giữ một phần nhỏ cho bản thân.

Một trong những hiểu nhầm đầu độc hình ảnh Musk nhiều nhất là hiệu ứng lồng chim và truyền thông hạn chế, theo kiểu biến anh thành một Tony Stark ngoài đời thực hoặc một Steve Jobs thứ hai trong tương lai. Trong một lần chụp ảnh, anh được yêu cầu mặc một chiếc áo đen cổ rùa, thứ vốn thành thương hiệu của Jobs, anh đã nhảy dựng lên. Anh nói với tôi: “Nếu tôi sắp chết và đang mặc một chiếc áo cổ rùa, bằng chút hơi tàn cuối cùng, tôi sẽ cởi chiếc cổ rùa ra và cố ném nó càng xa khỏi tôi càng tốt.”

Vậy Musk là người thế nào?

Anh giải thích: “Tôi cố gắng làm những việc có ích. Đó là một khát vọng tốt đẹp. Và hữu ích có nghĩa là nó có giá trị với phần còn lại của xã hội. Việc hữu ích là giúp cuộc sống của mọi người tốt hơn, giúp tương lai tươi sáng hơn, và tốt đẹp hơn, phải không? Tôi nghĩ chúng ta nên cố gắng làm tương lai tốt đẹp hơn.”

Khi được yêu cầu định nghĩa từ “tốt hơn”, Musk giải thích: “Có thể tốt hơn nếu chúng ta giảm nhẹ tác động từ việc trái đất đang nóng lên và làm bầu không khí trong các thành phố sạch sẽ hơn, không khoan dò lượng lớn than, dầu và khí đốt khắp nơi trên thế giới khiến chúng có thể gây ra vấn đề và sẽ cạn kiệt nay mai.”
“Nếu chúng ta là một giống loài sống trên nhiều hành tinh, có thể giảm khả năng một sự kiện đơn lẻ nào đó, nhân tạo hay tự nhiên, làm nền văn minh này biến mất như chúng ta từng biết, với khủng long. Có 5 sự kiện tuyệt chủng lớn nhất trong các tài liệu về hóa thạch. Con người không có hiểu biết về những sự kiện này. Trừ khi bạn là gián hay nấm – hoặc miếng bọt biển – còn không bạn sẽ bị tiêu đời.” Anh cười sắc bén. “Nó là bảo hiểm nhân thọ như chúng ta biết, và khiến tương lai tràn đầy cảm hứng nếu chúng ta đi tới các vì sao và bạn có thể chuyển tới sống ở một hành tinh khác nếu muốn.”

Đó là lý tưởng của Musk. Dù căn bản điều đó thực sự rất hiếm khả năng thành công. Hãy nghĩ về những tên tuổi đi kèm với những phát minh thay đổi trong thế kỷ này: họ là những người tạo ra các hệ điều hành, các thiết bị, các nền tảng websites hay mạng xã hội. Ngay cả nếu không bắt đầu theo cách đó, những lý tưởng của họ đa số đều là: làm sao tôi có thể biến công ty của mình thành trung tâm trong thế giới người dùng? Kết quả, các trang mạng xã hội như Facebook hay Twitter sử dụng nhiều thủ thuật để kích hoạt các trung tâm tưởng thưởng cho hành vi nghiện trong bộ não người dùng.

Nếu nhân viên của Musk gợi ý làm một cái gì đó như thế, anh ấy có lẽ nhìn họ như thể họ bị điên. Loại tư duy này không tính toán. Anh thẳng thắn nói: “Thật ra thì không nhất quán không phải là cách bạn muốn thế giới trở thành như thế, và rồi bằng vài cách gian lận, khiến thế giới hoạt động theo một nguyên tắc đạo đức trong khi phần còn lại của thế giới hoạt động theo cách khác. Điều này rõ ràng không phải là cách mọi thứ vận hành. Nếu mọi người đều cố lừa gạt người khác mọi nơi mọi lúc, sẽ có rất nhiều nhiễu và nhầm lẫn. Tốt hơn là hãy thẳng thắn và cố làm những gì hữu ích.”

Anh nói về việc xây dựng căn cứ vĩnh cửu trên mặt trăng, và tiếp tục tài trợ cho SpaceX bằng cách tạo ra các tên lửa hành trình có khả năng đi tới bất kỳ thành phố nào trên thế giới trong vòng ít hơn 1 giờ, một dạng giao thông mà anh gọi là “từ trái đất đến trái đất (Earth – to – Earth)”. Tôi hỏi, liệu đã có điều gì anh tin tưởng trở thành hiện thực khiến mọi người kinh ngạc chưa.
“Tôi nghĩ phải chính xác với sự thật. Trung thực và chính xác. Tôi cố nói với mọi người ‘Bạn không phải đọc đâu đó giữa các dòng cho tôi. Tôi đang nói các dòng đó đây.”

------------------

Một dịp khác, tôi quan sát Musk trong một cuộc họp hằng tuần với nhóm kỹ thuật của SpaceX, tám kỹ sư ngồi quanh một cái bàn trong những chiếc ghế đỏ cao thành, đang chỉ cho Musk một bản PowerPoint cập nhật những thông tin mới nhất về thiết kế tàu vũ trụ lên Sao Hỏa. Trong khi Musk tiếp tục theo dõi chi tiết kỹ thuật với những bộ não xuất sắc nhất trong lĩnh vực không gian vũ trụ, anh cũng đưa thêm một yếu tố bên ngoài phạm vi logistic và kỹ thuật.
Anh đưa ra lời khuyên tại một điểm: “Hãy chắc chắn nó trông không bị xấu đi hay gì đó.” “Thẩm mỹ của cái này không quá tốt. Giống như con thằn lằn đang sợ hãi.” Và sau một khoảng thời gian đối đáp: “Khi anh hạ cánh trên Sao Hỏa, anh sẽ muốn danh sách những thứ khiến anh phải lo ngại đủ nhỏ để khiến anh không bị chết.”

Nói chung, chủ đề trong phản hồi của Musk: Đầu tiên, mọi thứ phải hữu ích, logic và có thể thành hiện thực về mặt khoa học.

Sau đó anh sẽ nhìn vào việc cải tiến hiệu quả ở mọi cấp độ: mọi người sẽ chấp nhận điều gì như một tiêu chuẩn công nghiệp khi đã có cả phòng đầy các cải tiến đáng kể?

Từ đó, Musk thúc đẩy để sản phẩm cuối cùng đẹp, đơn giản, hay ho và bóng bẩy về mặt thẩm mỹ. (một nhân viên nói: “cậu ấy ghét những vết sứt sẹo”) và khi Musk đưa nó vào trong một thời điểm nào đó của cuộc họp, “thật đáng kinh ngạc”.

Suốt quá trình này, có một yếu tố bổ sung mà rất ít công ty cho phép: sự cá nhân hóa. Điều này thường liên quan đến việc Musk thêm những quả trứng phục sinh và các tham chiếu cá nhân tới các sản phẩm, chẳng hạn làm hệ thống âm thanh của Tesla đạt tới mức 11 (tôn sùng nhóm nhạc Spinal Tap) hay gửi một “thành phần bí mật” vào không gian trong lần phóng chiếc Dragon đầu tiên để nó biến thành một bánh xe pho mát (tôn sùng Monty Python).

Ngoài những điều này, điều khiến các nhân viên của Musk thấy nực cười hay thú vị, phụ thuộc vào cái bạn yêu cầu, là khoảng thời gian anh kỳ vọng chúng được hoàn thành. Ví dụ, một ngày thứ sáu khi tôi tới thăm, vài nhân viên SpaceX đang nhảy nhót tít mù ngược trên đường từ văn phòng tới bãi đỗ xe. Hóa ra trong một cuộc họp, anh ấy đã hỏi họ mất bao lâu để chuyển xe của nhân viên khỏi bãi đỗ và bắt đầu đào hố đầu tiên cho đường hầm của công ty Boring. Câu trả lời: hai tuần.
Musk hỏi tại sao, và khi thu thập được các thông tin cần thiết, anh kết luận: “Chúng ta hãy bắt đầu hôm nay và xem cái hố nào lớn nhất chúng ta có thể đào được từ giờ tới chiều chủ nhật, khi đào liên tục 24 giờ mỗi ngày.” Chỉ trong vòng 3 giờ, ô tô đã biến mất và có một cái hố trên mặt đất.

Nói cách khác, điều Musk nổi tiếng là anh đặt ra những thời hạn đầy tham vọng mà anh thường không thể hoàn thành. Roadster, Model S và Model X đều bị trễ so với thời hạn gốc, và giờ là Model 3 – với danh sách đợi gần nửa triệu người – cũng đang bị trễ khâu sản xuất. Có nhiều lý do cho điều này, nhưng Musk tóm tắt: “Làm điều tốt mà bị trễ còn hơn làm điều tệ mà xong sớm.” Vì thế hãy hy vọng Musk hoàn thành nó, chứ đừng hy vọng đúng tiến độ. Vì nếu anh ấy không thể làm nó, anh ấy sx không giả vờ thế này hay thế kia.


Tên lửa Falcon 9 và tàu vũ trụ Dragon của SpaceX được phóng lên từ giàn phóng phức hợp Launch Complex 40 tại Mũi Canaveral ngày 8 tháng 4 năm 2016. Getty.

Musk nói: “Tôi hy vọng sẽ thua.” Anh ở trong tòa nhà ba tầng ở San Francisco chỉ mới được trang hoàn gần đây. Nó từng thuộc về Stripe, chuyên xử lý thanh toán bằng thẻ tín dụng, nhưng giờ thuộc về Musk, làm ngôi nhà cho hai trong số các công ty của anh: Neuralink và OpenAI.

Có vài quan điểm về việc Tesla hay SpaceX có lẽ từng trông như thế nào khi chúng mới bắt đầu hình thành. Một nhóm nhỏ những người đam mê làm việc với những nguồn lực hữu hạn để đạt được một mục tiêu tham vọng và xa vời. Nhưng không giống như Tesla và SpaceX, chả có gì liên quan giữa con đường đi tới mục tiêu, và hai công ty này cũng không có gì rõ ràng đến vậy.

OpenAI là một tổ chức phi lợi nhuận để giảm thiểu mối nguy hiểm của trí tuệ nhân tạo, còn Neuralink đang nghiên cứu những cách cấy ghép công nghệ vào não người để tạo ra những giao diện trí tuệ - máy tính.

Nếu nghe có vẻ mâu thuẫn thì hãy nghĩ lại. Neuralink cho phép bộ não chúng ta theo kịp cuộc đua với trí tuệ nhân tạo. Máy móc sẽ không thể thông minh hơn chúng ta nếu chúng ta có mọi thứ máy móc có cộng thêm mọi thứ chúng ta có. Ít ra, nếu bạn thực sự cho rằng chúng ta có lợi thế.

Đây là một ngày bất thường tại văn phòng: Musk đang trình chiếu một tài liệu về trí tuệ nhân tạo cho nhân viên Neuralink. Anh đứng trước họ trong khi họ ngồi đùa nghịch trên băng ghế dài và những chiếc ghế đơn, và đưa ra những tỷ lệ kinh ngạc trong sứ mệnh làm AI an toàn: “Có lẽ có 5 tới 10 phần trăm cơ hội thành công.”

--------------

Thách thức anh đang làm cùng OpenAI đang nhân đôi. Trước tiên, vấn đề với việc xây dựng một cái gì đó thông minh hơn bạn chính là … nó thông minh hơn bạn. Cộng với thực tế nữa là AI không có hối hận, không có đạo đức, không có tình cảm – và nhân loại có lẽ sẽ ngập sâu trong rắc rối. Đây là cơ hội thứ hai của cậu con trai tốt bụng trước người cha không biết hối lỗi và không thể thay đổi.
Thách thức thứ hai là OpenAI là tổ chức phi lợi nhuận, nó đang phải cạnh tranh với những nguồn lực khổng lồ từ DeepMind của Google. Musk bảo với cả nhóm rằng anh thực tế đã đầu tư vào DeepMind và vẫn duy trì con mắt thận trọng để quan sát sự phát triển AI của Google.

Anh giải thích cho tôi: “Giữa Facebook, Google và Amazon – và kể cả Apple, họ đều có vẻ quan tâm đến tính riêng tư – họ có nhiều thông tin về bạn hơn bạn tưởng. Có nhiều rủi ro khi tập trung quyền lực. Vậy nên nếu AGI [artificial general intelligence – trí tuệ nhân tạo tổng hợp] đại diện cho một mức độ quyền lực cực kỳ lớn, nó có nên được đặt dưới sự quản lý của một số ít người ở Google mà không cần giám sát ư?”

“Chúc ngủ ngon!” Musk cười đùa khi bộ phim kết thúc. Rồi anh dẫn dắt một cuộc thảo luận về nó, viết ra một số ý tưởng và thẳng thừng bác bỏ một số ý kiến khác. Khi anh đang nói, anh với cái bát, nhặt ít bỏng ngô, bỏ vào miệng và bắt đầu ho.

Anh lẩm bẩm: “Chúng ta đang nói về những mối đe dọa với nhân loại, còn tôi sắp chết vì bắp rang.”

9h tối thứ năm, tôi đang đợi ở tiền sảnh căn nhà của Musk ở Bel Air để phỏng vấn lần cuối. Vài phút sau anh ấy bước xuống cầu thang, mặc áo phông có hình chuột Mickey trong không gian. Một phụ nữ tóc vàng cao ráo đi theo anh xuống lầu.

Đúng với lời nói của mình, anh không cô đơn.

Người phụ nữ đó hóa ra là Talulah Riley, vợ thứ hai của anh. Họ gặp nhau năm 2008, và Musk cầu hôn chỉ sau 10 ngày. Họ cưới nhau năm 2010, rồi ly dị 2 năm sau đó, lại cưới lại vào năm sau, rồi nộp đơn ly hôn lần nữa, rồi rút đơn, rồi nộp lại đơn ly hôn và cuối cùng cứ thế đường ai nấy đi.

Musk gợi ý làm một điều hiếm hoi với anh: uống rượu. Anh nói: “Khả năng uống rượu của tôi không cao lắm. Nhưng tôi sẽ thành một con gấu mù mờ khi uống. Tôi mù mờ một cách vui vẻ.”

Anh rót 2 ly whisky cho chúng tôi, và cả ba chúng tôi ngồi lại phòng khách, nơi có một máy ghi âm bằng cơ hiệu Edison, một máy Enigma và một chiếc đài sóng ngắn từ thời chiến tranh thế giới thứ nhất đang được trưng bày.

Trong buổi phỏng vấn, Riley ngồi trên ghế gần đó, nửa quan tâm tới cuộc trò chuyện, nửa chú ý vào điện thoại của cô.

Musk đang trong tâm trạng khác với lúc ở SpaceX, và đó là điều những người quen biết Musk đều nhận ra được. Một lúc, anh đọc những dòng yêu thích từ chương trình TV hoạt hình vừa xem, kế đến anh có thể đưa ra vài hướng dẫn chi tiết, kế tiếp lại bỏ qua bạn khi lạc vào một suy nghĩ, sau đó lại hỏi bạn lời khuyên về một vấn đề, sau nữa lại cười như tắc thở khi nghe một đoạn hài khoảng chừng 5 phút, rồi lại hành động như thể cả hai chưa từng gặp mặt. Và qua tất cả những việc đó, bạn học được rằng, đừng cá nhân nó quá vì có khả năng lớn là chả có gì để làm với bạn.

Chúng tôi bắt đầu nói chuyện, hay ít nhất đang cố nói với tôi về AI, vì vài tuần trước, Musk đã đăng trên Twitter: “Cạnh tranh mức độ ưu việt của AI cấp quốc gia rất có thể gây ra chiến tranh thế giới thứ 3.”

Nhưng khi tôi hỏi anh về điều này, Musk trở nên gay gắt: “Tôi không có câu trả lời. Tôi sẽ không nói rằng tôi có toàn bộ câu trả lời. Hãy để tôi thực sự rõ ràng về điều này. Tôi đang cố gắng tìm ra các hành động có khả năng tạo ra một tương lai tốt đẹp. Nếu anh có ý tưởng gì cho nó, hãy nói cho tôi đó là gì.”

Riley phụ họa theo: “Tôi chỉ nghĩ cách nó cần được nhấn mạnh là ‘Elon Musk nói chúng ta sắp chết hết’, trái ngược với ‘Này, chúng ta hãy nghĩ ra vài qui tắc.’”

Musk, đã nhanh chóng trở nên tỉnh táo, không còn mang tâm trạng khi nói về công việc. Thay vào đó, anh có vài lời khuyên anh muốn đưa cho thế giới từ trải nghiệm cá nhân: “Tôi thấy người ta đều rút ra bài học từ trường đời.” Anh bắt đầu cười nửa miệng. “Và một bài học tôi nhận được là, đừng tweet về Môi trường xung quanh. Điều này có trong tài liệu: Tán chuyện về Môi trường xung quanh là không khôn ngoan. Anh sẽ phải hối tiếc vì điều đó.”

Musk với lấy cuốn sách về cà phê được xuất bản bởi The Onion và bắt đầu lật các trang, đùa cợt: “Để hiểu bản chất thật sự của mọi thứ” – anh triết lý – “tôi nghĩ anh có thể tìm nó trong The Onion và đôi khi trên Reddit.”

Sau đó anh hỏi đầy hào hứng: “Đã bao giờ anh xem Rick and Morty chưa?” Cuộc nói chuyện chuyển sang phim hoạt hình, rồi tới South Park, tới nhà Simpsons, tới sách Hướng dẫn đến Dải Ngân Hà của Hitchhiker.

Musk nói, một trong những dòng từ cuốn sách của Hitchhiker đã trở thành Qui Tắc Số Một Của Nhà Musk: “Đừng sợ hãi.”

Riley giải thích: “Bọn trẻ luôn bất kham trong mọi chuyện.”
Musk tiếp tục: “Đó là qui tắc khác của chúng tôi. Cái thứ ba là An Toàn. Đó không hẳn là qui tắc Số Hai. Nhưng dù chẳng có gì ở vị trí số hai thì an toàn cũng không được cho lên hạng hai.”

Chúng tôi bị Teller – Chánh văn phòng của Musk – làm gián đoạn, ông ấy thông báo cho anh rằng khi chúng tôi đang nói chuyện, Hội Đồng Thành Phố Hawthorne đã kết thúc cuộc thảo luận một giờ đồng hồ với tỷ lệ bỏ phiếu 4-1 để cho phép Musk đào đường hầm 2 dặm trong thành phố.

Musk nói: “Tốt, giờ chúng ta có thể đào qua dòng bất động sản của chính mình. Hãy đào như điên vào!”

Anh cười lớn lúc nói thế, và giờ tôi hiểu ra rằng Musk đã không còn muốn nói cho tôi về những dự án và tầm nhìn của anh ấy. Chả thu được gì nếu cứ nói những vấn đề khoa học với một người không hiểu chúng. Cuối ngày, anh chỉ muốn thư giãn và cười với thế giới anh đang cố gẳng cải thiện nó.

Tôi rời khỏi ngôi nhà anh mà vẫn nghe thấy tiếng cười của anh ở ngưỡng cửa, hy vọng khi thuộc địa Sao Hỏa xây dựng những tượng đài đầu tiên của Musk, đó không phải là hình ảnh một người đàn ông cứng cỏi với biểu cảm cứng nhắc đang nhìn vào không gian, mà là hình ảnh của một chú gấu đang mơ màng.

Ngày 15 tháng 11 năm 2017




Chủ Nhật, 26 tháng 11, 2017

eCommerce: Thương mại điện tử sẽ ở đâu trong 10 năm tới?



Thương mại điện tử (eCommerce) sẽ ở đâu trong 10 năm tới?

Những người sáng lập ra Harry’s Razors, gồm Jeff Raider và Andy Katz-Mayfield, còn được giới truyền thông Đức gọi là “những tay cao bồi internet của nước Mỹ” sau vụ mua lại nhà máy sản xuất dao cạo trị giá $100 triệu đô ở Eisfeld, Đức.

Bạn có lẽ sẽ tự hỏi… tại sao lại có người muốn dùng tiền kiểu này đổ vào một nhà máy dao cạo? Những người sáng lập Harry’s Razors chính là kiểu này.

Jeff và Andy đã thiêu cháy thế giới thương mại điện tử sau khi quyết định ném cả tấn tiền vào các thương hiệu cạo râu lớn và đắt đỏ như Gillete và Schick. Sự thất bại của họ cuối cùng đã có thể giúp họ tạo ra một lực lượng yêu thích toàn cầu trên thương mại điện tử dành cho Harry’s Razors – một startup chỉ trong năm 2015 đã có giá $750 triệu và từ đó trở đi chỉ có tăng.

Harry’s  - cùng với các nhãn hàng như Bonobos, Trunk Club và Zappos (gần đây đã bị Amazon mua lại) – chỉ là một vài siêu sao có trách nhiệm chứng minh với cả thế giới rằng thương mại điện tử không chỉ thức thời mà lợi nhuận còn cực kỳ hấp dẫn.

Vì thương mại điện tử đã và đang tiếp tục tăng trưởng với tốc độ điện, sự cạnh tranh cũng vậy. Ví dụ, Harry’s Razors đang cạnh tranh trực tiếp với Dollar Shave Club, một công ty có mô hình tương tự từng là thương hiệu dao cạo làm nên cách mạng, đã được Unilever mua lại với giá $1 tỷ vào năm 2016.

Để duy trì tính cạnh tranh trong thế giới thương mại điện tử, quan trọng là bạn nên nhìn lên một chút. Chúng ta nghĩ thương mại điện tử sẽ ở đâu trong 10 năm tới?

Gần đây tôi đã hỏi một số nhà lãnh đạo hàng đầu trong làng thương mại điện tử để biết quan điểm của họ về thứ chúng ta đang hướng tới. Hy vọng rằng những quan điểm này sẽ cho bạn suy nghĩ tốt hơn về tương lai của thương mại điện tử và làm thế nào bạn có thể đi lên phía trước đám đông.

Một bộ phận quyền lực nằm giữa các cửa hàng trực tuyến Big – Box và các nhà bán lẻ tập trung nhỏ hơn

“Trong 10 năm tới, tôi nghĩ chúng ta sẽ thấy sự phân chia lớn lao trong thế giới thương mại điện tử. Một bên chúng ta có Amazon, một nguồn đáng tin cậy cho mọi loại mặt hàng. Còn bên kia, bạn sẽ thấy các cửa hàng và các thương hiệu độc lập, được gắn chặt vào một dòng sản phẩm độc quyền hoặc một loại dịch vụ chuyên dụng – thực ra đó là 2 cách duy nhất để cạnh tranh với Amazon. Các cửa hàng thương mại điện tử bán sản phẩm của người khác mà không có sự khác biệt nhiều sẽ hầu như, nếu không muốn nói là hoàn toàn, biến mất.”
-                      Andrew Youderian của eCommerceFuel.com

Andrew Youderian là người sáng lập ra eCommerce Fuel, một cộng đồng trực tuyến riêng của trên 1000 doanh nghiệp thương mại điện tử nhằm giúp đỡ nhau tăng trưởng kinh doanh cao tới 6-7 con số. Rõ ràng anh rất tường tận thế giới này và tin rằng, trong tương lai, thương mại điện tử sẽ bị phân chia sâu hơn nữa.

Andrew giải thích rằng Amazon đã trở thành vua của thương mại điện tử và một trong những cách duy nhất để cạnh tranh với họ là đưa ra những sản phẩm chuyên dụng. Harry’s là ví dụ điển hình về một doanh nghiệp có khả năng cạnh tranh nhờ sản phẩm trong thị trường ngách – dao cạo cho nam giới. Mặc dù sản phẩm của họ không mới, nhưng họ đã thành công trong việc tạo ra một thay đổi đầy sáng tạo trong một sản phẩm tiêu dùng hằng ngày, dù sản phẩm đó không có nhiều thay đổi suốt một thời gian dài.

Harry’s đã đổi mới trong cả sản phẩm lẫn cách người tiêu dùng mua sản phẩm – thay vì đến các cửa hàng tiện lợi để nhặt lưỡi dao và kem cạo râu, Harry’s đưa nó trực tiếp tới tận cửa nhà bạn. Tiết kiệm cho khách hàng cả thời gian và tiền bạc.

Tăng trưởng khổng lồ vì thương mại điện tử bước vào Kỷ nguyên Vàng

“Chúng ta đã bắt đầu nhìn thấy sự sụp đổ của bán lẻ truyền thống, và vài thứ khác nữa trong những năm tới. Ngày nay, thương mại điện tử chiếm dưới 10% doanh số bán lẻ ở Mỹ. Trong 10 năm tới, tôi hy vọng con số đó sẽ khoảng 50%. Chúng ta sẽ thấy hàng trăm tỷ đô doanh thu chảy khỏi các cửa hàng bằng gạch và vữa, và toàn bộ số tiền đó sẽ được phân phối tới hàng ngàn nhà cung cấp dịch vụ thương mại điện tử mới. Chúng ta đang bước vào kỷ nguyên vàng khi các doanh nghiệp và người tiêu dùng thương mại điện tử đang tăng trưởng như vũ bão.”
-                      Will Mitchell của StartupBros.com

Will Mitchell quyết định tạo StartupBros với hy vọng giúp đỡ và tạo động lực cho các doanh nghiệp bắt đầu xây dựng việc kinh doanh trực tuyến của chính mình. Anh đã thành công lớn trong lĩnh vực thương mại điện tử - thu được hàng ngàn đô khi chưa tới 18 tuổi.

Anh tin rằng thương mại điện tử phải đạt được gần 50% tổng số doanh thu và số lượng bán lẻ trong tương lai. Vì thế, trong khi thương mại điện tử có vẻ như là một phong trào rầm rộ ngày nay, thì 10 năm nữa, nó sẽ là tình trạng xâu xé lẫn nhau trên qui mô lớn.

Những nhãn hàng dành thời gian bây giờ để tạo lập bản thân thành kẻ đứng đầu trong thế giới thương mại điện tử thì sẽ có khả năng thành người khổng lồ trong tương lai, khi ngành công nghiệp này tiếp tục tăng trưởng.

Đưa Thực tế ảo (Virtual Reality) vào thương mại điện tử
“Nhìn vào những năm tới, tôi nghĩ tương lai thương mại điện tử là với VR, khi bạn có khả năng kiểm tra một sản phẩm trong tay trước khi mua. Hơn nữa, toàn bộ trải nghiệm mua sắm sẽ được cá nhân hóa theo phong cách cá nhân và các tham số từ chính bạn.”
-                      Steve Chou của MyWifeQuitHerJob.com

Steve Chou là một nhà kinh doanh internet khác, người đã tạo dựng được danh tiếng trong làng thương mại điện tử. Anh quyết định bắt đầu My Wife Quit Her Job sau khi… phải, bạn đã đoán ra, … sau khi vợ anh mất việc.

Steve tưởng tượng ra rằng 10 năm tới, thực tế ảo sẽ cho phép người mua sắm trực tuyến cầm nắm được các sản phẩm trong tay trước khi quyết định mua nó từ máy tính hay điện thoại của mình. Dù hiện nay các bức ảnh sắc nét cũng cực kỳ hiệu quả khi khiến khách hàng cảm thấy tin tưởng vào những gì họ sắp mua, nhưng chúng vẫn chỉ là ảnh 2 chiều. Hãy tưởng tượng bạn có thể cảm nhận, cầm giữ hay chạm vào một sản phẩm trước khi mua nó.

Cải tiến giao hàng và phân phối

“Dựa trên báo cáo về giao hàng hóa trong lĩnh vực thương mại năm 2017, chúng ta đã thấy được khả năng thúc đẩy trải nghiệm khách hàng (customer experience – CX) bằng giao hàng và hoàn thành đơn hàng thông minh chính là một trong những tài sản lớn nhất một nhà bán lẻ phải có trong 10 năm tới. Đã có 43% nhà bán lẻ nhìn thấy việc bán hàng gia tăng khi đưa ra các lựa chọn giao hàng tốt hơn. Với chi phí, tốc độ và sự thuận tiện là những mối quan tâm chính trong hành trình mua sắm của người tiêu dùng, các nhà bán lẻ có thể bước vào thế giới chất lượng đa dạng và linh hoạt của công nghệ vận chuyển để giúp quản lý các nhu cầu đang không ngừng tăng lên ngày nay và trong tương lai.” – Carl Hartmann, CEO và đồng sáng lập Temando.

Nếu nói có một lĩnh vực đã cản trở kinh doanh thương mại điện tử trong suốt thập kỷ qua, thì đó chính là giao hàng.

Từ những năm 40 và 50, người ta có thể nhảy nhót trong ô tô, ghé thăm một cửa hàng, mua bán và ngay lập tức có sản phẩm trong tay. Về mặt tự nhiên, con người bị ràng buộc vào điều kiện mong đợi sự thỏa mãn tức khắc, khiến chúng ta trở nên thiếu kiên nhẫn khi chờ đợi… cho bất cứ điều gì.

Vận chuyển là con đường tuyệt vời để một nhãn hàng phân biệt nó với các đối thủ cạnh tranh. Nói chung, hầu hết người tiêu dùng thích việc mua sắm online có kết quả trong vài ngày chứ không phải vài tuần. Và họ không bao giờ muốn nghe tin rằng gói hàng của mình đã bị thất lạc.

Carl Hartmann là một trong những CEO hàng đầu trong lĩnh vực thương mại điện tử và đã giúp Temando tăng trưởng tới trên 60.000 người đăng ký – phục vụ những thương hiệu hàng đầu như Toy’s R Us và Nike. Khỏi cần nói, Carl đã dành rất nhiều giải thưởng, trong đó có giải IBM Global Entrepreneur of the Year (nhà kinh doanh sản phẩm IBM toàn cầu của năm), cũng như giải Deloitte Technology Fast 50 (top 50 doanh nghiệp có công nghệ tăng trưởng nhanh nhất của Deloitte).

Nhiều năm qua, anh đã nhận thấy nhiều phiền não những người tiêu dùng qua thương mại điện tử đã gặp phải và tích cực làm việc để giảm thiểu chúng, thông qua vận chuyển hàng hóa rẻ hơn, nhanh hơn và thuận tiện hơn.

Trong 10 năm tới, những tên tuổi nổi bật trong thế giới thương mại điện tử sẽ là những tên tuổi luôn phấn đấu đưa ra dịch vụ giao hàng đẳng cấp thế giới. Họ luôn hỏi câu hỏi: Chúng ta có thể giao hàng cho khách theo ngày, giờ và địa điểm họ thích như thế nào?

Luận điểm cuối này sẽ đóng vai trò kết luận vì gói gọn toàn bộ chủ đề cơ bản của bài viết: Làm sao chúng ta tới nơi chúng ta sẽ tới nhanh hơn?

Bạn đang làm gì – hôm nay – để thích ứng với những xu hướng này trong tương lai? Bạn có nghĩ mình là một trong những trung gian sẽ biến mất trong bộ phận quyền lực này? Nếu vậy, bạn sẽ đi theo hướng nào? Có cách nào giúp doanh nghiệp của bạn gần với các tiêu chuẩn VR mà chỉ cần vài bức ảnh sản phẩm đơn giản? Hoặc liệu bạn có tiếp tục phớt lờ những vấn đề của giao hàng vì bạn không thích gánh thêm chi phí?

Nếu có một điều mà tất cả chúng ta đều biết về các tiên đoán công nghệ, thì đó chính là việc chúng luôn luôn trở thành sự thật nhanh hơn chúng ta từng mong đợi.

Bạn đã sẵn sàng chưa?

Holly Cardew
Từ Medium.com

Chủ Nhật, 19 tháng 11, 2017

Machine Learning cho mọi người - 5: Học tăng cường (Reinforcement Learning)



5. Học tăng cường
(Reinforcement Learning)
Thăm dò và khai thác. Qui trình ra quyết định Markov. Học theo mô hình Q, học theo qui tắc, và học sâu tăng cường.

“Tôi chỉ ăn một ít sôcôla để hoàn thành phần cuối này.”
Trong học có giám sát, dữ liệu đào tạo đi theo một từ khóa trả lời từ đối tượng giống như “người giám sát”. Giá mà cuộc sống chỉ làm việc theo cách đó!

Trong học tăng cường (reinforcement learning – RL), không có từ khóa trả lời, nhưng agent học tăng cường của bạn vẫn phải quyết định cách vận hành tác vụ của nó. Khi vắng mặt dữ liệu đào tạo, agent sẽ học từ kinh nghiệm. Nó tập hợp các ví dụ đào tạo (“hành vi này tốt, hành vi kia xấu”) thông qua thử và sai khi cố gắng hoàn thành nhiệm vụ, với mục tiêu tối đa hóa lợi ích trong dài hạn.

Trong phần cuối này, chúng ta sẽ khám phá:
-          Đánh đổi thăm dò/khai thác
-          Qui trình ra quyết định Markov (Markov Decision Processes – MDP), cách xây dựng cổ điển các tác vụ RL
-          Học theo mô hình Q, theo qui tắc và học sâu tăng cường
-          Cuối cùng, bài toán học giá trị

Cuối cùng, luôn luôn vậy, chúng tôi sẽ tập hợp vài tài nguyên thú vị để khám phá sâu hơn.

Hãy đặt con chuột robot vào trong mê cung
Tình huống đơn giản nhất để nghĩ về học tăng cường là trong các trò chơi có mục tiêu rõ ràng và một hệ thống tính điểm.

Có thể nói chúng ta đang chơi một trò chơi trong đó con chuột của chúng ta đang tìm kiếm phần thưởng tối đa là miếng pho-mat ở cuối mê cung (+1000 điểm), hoặc phần thưởng nhỏ hơn là các giọt nước trên đường (+10 điểm). Đồng thời, con chuột robot muốn tránh các vị trí có điện giật (-100 điểm).


Phần thưởng là miếng pho-mat.

Sau một lúc thăm dò, con chuột có lẽ sẽ tìm thấy thiên đường mini với 3 giọt nước gần lối vào, rồi dùng toàn bộ thời gian để khai thác phát hiện này bằng cách tiếp tục tận thu những phần thưởng nhỏ là các giọt nước mà không bao giờ có thể tiến sâu hơn vào mê cung để theo đuổi phần thưởng lớn hơn.

Như bạn có thể thấy, con chuột có thể lỡ mất cơ hội tốt hơn để tiến sâu vào mê cung, với phần thưởng tuyệt đối là miếng pho-mat ở cuối đường.

Điều này gọi là sự đánh đổi thăm dò/thăm dò. Một chiến lược đơn giản là “thăm dò” - con chuột đã sử dụng trong hầu hết thời gian (80% thời gian), nhưng thường là thăm dò một hướng đi mới, ngẫu nhiên, dù có thể càng lúc càng xa phần thưởng lớn.

Chiến lược này còn được gọi là “epsilon tham lam”, trong đó epsilon là phần trăm thời gian agent sử dụng cho một hành động ngẫu nhiên chứ không phải là hành động để tối đa hóa lợi ích đã biết (trong trường hợp này, là 20%). Chúng ta thường bắt đầu với nhiều thăm dò (ví dụ, giá trị cao hơn cho epsilon). Theo thời gian, khi con chuột học được ngày càng nhiều về mê cung và hành động nào được phần thưởng dài hạn nhất, nó sẽ muốn giảm dần epsilon xuống 10% hoặc thậm chí thấp hơn khi nó đi vào khai thác những gì nó biết.

Quan trọng phải ghi nhớ rằng, phần thưởng không phải lúc nào cũng có tức thì: trong ví dụ con chuột robot, có một diện tích rộng của mê cung bạn phải thăm dò và vài điểm cần ra quyết định trước khi bạn tìm được miếng pho-mat.


Agent quan sát môi trường, hành động để tương tác với môi trường, và nhận được kết quả tích cực hay tiêu cực. Sơ đồ trích trong tài liệu CS 294: Deep Reinforcement Learning từ Berkeley, của John Schulman & Pieter Abbeel

Qui trình ra quyết định Markov (MDP)
Suy nghĩ của con chuột trong mê cung có thể mô hình hóa theo Qui trình ra quyết định Markov, là một qui trình xác định xác suất khi chuyển từ trạng thái này sang trạng thái kia. Chúng ta sẽ giải thích bằng ví dụ về con chuột robot. MDP gồm:
1.      Một tập trạng thái xác định. Đó là những vị trí con chuột có thể ở trong mê cung.
2.      Một tập hành động sẵn có cho mỗi trạng thái. Đó là tập {tiến, lùi} trên hành lang và {tiến, lùi, trái, phải} tại giao lộ.
3.      Chuyển trạng thái. Ví dụ, nếu bạn rẽ trái tại giao lộ, bạn sẽ kết thúc ở vị trí mới. Đó có thể là tập các xác suất gắn với nhiều hơn một trạng thái có thể xảy ra (ví dụ, khi bạn dùng một cú đấm trong trò Pokémon, bạn cũng có thể gây ra vài thiệt hại khác, hoặc có thể đủ để hạ knock out đối thủ).
4.      Phần thưởng đi kèm mỗi khi chuyển trạng thái. Trong ví dụ con chuột robot, hầu hết phần thưởng là 0, nhưng chúng sẽ là dương nếu bạn tới điểm có nước hay có phomat, và âm nếu bạn tới điểm bị điện giật.
5.      Hệ số chiết khấu y giữa 0 và 1. Con số này lượng hóa sự khác biệt về tầm quan trọng giữa phần thưởng tức thời và phần thưởng lâu dài trong tương lai. Ví dụ, y là 0,9 và có một phần thưởng 5 điểm sau 3 bước, giá trị hiện tại của phần thưởng là 0,93*5.
6.      Không có trí nhớ. Một khi trạng thái hiện tại được ghi nhận, lịch sử di chuyển của con chuột trong mê cung có thể bị xóa đi vì trạng thái Markov hiện tại đã chứa đựng mọi thông tin hữu ích trong lịch sử. Nói cách khác, “tương lai độc lập với quá khứ, trong khi hiện tại được cho đã biết.”

Giờ chúng ta đã biết MDP là gì, chúng ta có thể công thức hóa mục đích của con chuột. Chúng ta đang cố gắn tối đa hóa tổng số phần thưởng trong dài hạn:



Hãy nhìn từng thành phần của biểu thức trên. Đầu tiên, chúng ta đang tính tổng toàn bộ thời gian của các bước t. Hãy đặt y bằng 1 từ bây giờ và quên nó đi. Hàm r(x,a) là hàm phần thưởng. Với trạng thái x và hành động a (ví dụ rẽ trái tại giao lộ), nó cho bạn phần thưởng đi kèm. Trở lại biểu thức, chúng ta đang cố gắng tối đa hóa tổng các phần thưởng trong tương lai bằng cách hành động hợp lý nhất (tốt nhất) trong mỗi trạng thái.

Nào, chúng ta vừa xây dựng bài toán học tăng cường và công thức hóa mục tiêu, giờ hãy khám phá các giải pháp có thể xảy ra.

Q-learning: học hàm hành động – giá trị

Q-learning là kỹ thuật đánh giá hành động nào nên làm theo dựa trên một hàm hành động – giá trị. Hàm này xác định giá trị khi ở trong một trạng thái nhất định và làm theo một hành động nhất định trong trạng thái đó.

Chúng ta có hàm Q lấy đầu vào là một trạng thái và một hành động, rồi trả về phần thưởng kỳ vọng cho hành động đó (và toàn bộ các hành động kế sau đó) tại trạng thái này. Trước khi thăm dò môi trường, Q sẽ cho cùng một giá trị cố định (tùy ý). Nhưng sau đó, khi thăm dò được môi trường càng nhiều, Q sẽ cho chúng ta một xấp xỉ càng lúc càng tốt hơn về giá trị của hành động a tại trạng thái s. Chúng ta cập nhất hàm Q khi chúng ta di chuyển.

Biểu thức trên Wikipedia giải thích điều này rất rõ ràng. Nó cho thấy cách chúng ta cập nhật giá trị của Q dựa trên phần thưởng nhận được từ môi trường:



Hãy bỏ qua hệ số chiết khấu bằng cách lại đặt nó bằng 1. Đầu tiên, nhớ rằng đang giả thiết Q thể hiện tổng số phần thưởng khi lựa chọn hành động Q và các hành động này là tối ưu.
Giờ hãy tìm hiểu biểu thức từ trái sang phải. Khi chúng ta sử dụng hành động at ở trạng thái st, chúng ta cập nhật giá trị của Q(st,at) bằng cách thêm một biểu thức vào đó. Biểu thức này gồm:
-          Tỷ lệ học alpha: thể hiện bạn muốn tích cực thế nào khi cập nhật giá trị. Khi alpha gần tới 0, chúng ta sẽ không cập nhật tích cực. Khi alpha gần tới 1, chúng ta đơn giản chỉ thay giá trị cũ bằng giá trị mới cập nhật.
-          Phần thường: chính là phần thưởng chúng ta thu được khi hành động at tại trạng thái st. Vì thế chúng ta cộng cả phần thưởng này vào ước lượng cũ của mình.
-          Chúng ta cũng cộng thêm phần thưởng dự đoán trong tương lai, nó là phần thưởng tối đa có thể đạt được Q trước mọi hành động có thể làm tại xt+1.
-          Cuối cùng, chúng ta trừ đi giá trị của của Q để đảm bảo chênh lệch trong dự đoán chỉ có tăng hoặc giảm (tất nhiên chênh lệch này được nhân với alpha).

Giờ chúng ta đã có một ước lượng giá trị cho mỗi cặp trạng thái – hành động, chúng ta có thể chọn hành động nào để làm dựa theo chiến lược lựa chọn hành động của chúng ta (không cần chỉ chọn hành động có phần thưởng kỳ vọng lớn nhất mỗi lần, ví dụ với chiến lược thăm dò kiểu epsilon tham lam, chúng ta nên hành động ngẫu nhiên trong vài phần trăm thời gian).

Trong ví dụ con chuột robot, chúng ta có thể sử dụng Q-learning để tìm ra giá trị của mỗi vị trí trong mê cung và giá trị của các hành động (tiến, lùi, trái, phải) tại mỗi vị trí. Sau đó chúng ta có thể dùng chiến lược lựa chọn hành động để chọn việc gì con chuột thực sự phải làm tại mỗi bước thời gian.

Học theo qui tắc (policy learning): ánh xạ từ trạng thái tới hành động

Trong cách Q-learning, chúng ta học hàm giá trị ước lượng giá trị của mỗi cặp trạng thái – hành động.

Policy learning là một lựa chọn rõ ràng minh bạch hơn, trong đó chúng ta học một hàm policy (qui tắc) π, là một ánh xạ trực tiếp từ mỗi trạng thái tới hành động phù hợp nhất (tốt nhất) tại trạng thái đó. Hãy coi đó là một qui tắc cư xử: “khi tôi quan sát trạng thái s, việc tốt nhất cần làm là sử dụng hành động a”. Ví dụ, một qui tắc của phương tiện tự lái có thể rất hiệu quả, đó là: “nếu tôi thấy đèn vàng và tôi đang cách giao lộ hơn 100 feet, tôi nên phanh lại. Ngược lại, cứ tiếp tục đi thẳng.”


Một qui tắc là một ánh xạ từ trạng thái tới hành động.

Chúng ta đang học một hàm sẽ tối đa hóa phần thưởng kỳ vọng. Chúng ta có biết cái gì thực sự giỏi trong việc học các hàm phức tạp không? Chính là các mạng neuron mức sâu!

Tài liệu Pong from Pixels của Andrej Karpathy cung cấp một hiểu biết tuyệt vời để sử dụng học sâu tăng cường vào việc học một qui tắc trong trò chơi Pong của Atari: lấy các pixel thô từ trò chơi làm đầu vào (trạng thái) và cho ra xác suất di chuyển mái chèo lên hoặc xuống (hành động).


Trong mạng tính đạo hàm qui tắc, agent sẽ học qui tắc tối ưu bằng cách điều chỉnh trọng số bằng đạo hàm giảm (gradient descent) dựa trên tín hiệu phần thưởng từ môi trường. Ảnh lấy từ http://karpathy.github.io/2016/05/31/rl/

Nếu bạn muốn nhúng tay bẩn vào học tăng cường sâu, hãy đọc bài viết của Andrej. Bạn sẽ dựng một mạng policy 2 lớp trong 130 dòng code, rồi sẽ học cách xài Gym của OpenAI – cho phép bạn nhanh chóng chạy được thuật toán học tăng cường đầu tiên, kiểm tra nó trên vô số game, và xem hiệu suất của nó thế nào khi so sánh với phần người khác làm.

DQN, A3C, và những tiến bộ trong học tăng cường sâu (deep RL)

Vào năm 2015, DeepMind dùng một phương pháp gọi là mạng Q sâu (deep Q-network hay DQN), cách này xấp xỉ các hàm Q nhờ dùng mạng neuron mức độ sâu, để đánh bại các tiêu chuẩn của con người trong nhiều trò game của Atari:
Chúng tôi minh họa một agent của mạng Q sâu, chỉ nhận các pixel và điểm game làm đầu vào, có khả năng vượt qua hiệu năng của toàn bộ các thuật toán trước đó và đạt được cấp độ tương đương với một game thủ chuyên nghiệp (là con người) trong tập 49 trò game, sử dụng cùng giải thuật, cùng kiến trúc mạng và cùng các siêu tham số. Nó hoạt động như cầu nối giữa những đầu vào và hành động sensor có số chiều cao, cho ra kết quả là một agent nhân tạo đầu tiên có khả năng học xuất sắc một dải rộng các tác vụ khó khăn. (Silver et al., 2015)

Đây là cái nhìn nhanh chóng về vị trí của DQN agent khi so sánh với máy học tuyến tính và con người trong nhiều lĩnh vực:


Các con số này được chuẩn hóa theo những người kiểm thử là các game thủ chuyên nghiệp: 0% - chơi ngẫu nhiên, 100% - hiệu năng của con người. Nguồn: tài liệu về DQN của DeepMind Human – level control through deep reinforcement learning.

Để giúp bạn xây dựng vài trực giác về cách các tiến bộ trong nghiên cứu RL làm được, đây là vài ví dụ về những cải tiên của bộ xấp xỉ dùng hàm Q phi tuyến giúp nâng cao hiệu năng và độ ổn định:
-          Lặp lại trải nghiệm: học bằng cách ngẫu nhiên hóa theo một chuỗi dài hơn các quan sát trước đó và phần thường đi kèm để tránh overfiting với các trải nghiệm hiện tại. Ý tưởng này lấy cảm hứng từ bộ não sinh học: ví dụ chuột chạy trong mê cung, sẽ “lặp lại” các mẫu trong hoạt động của tế bào thần kinh khi ngủ để tối ưu hóa hành vi tương lai trong mê cung.
-          Mạng neuron tái phát (RNN): tăng cường DQN. Khi một agent chỉ có thể nhìn thấy môi trường tức thời ngay xung quanh nó (ví dụ con chuột robot chỉ thấy một đoạn mê cung nhất định – so với con chim có thể nhìn được toàn bộ mê cung), agent cần nhớ bức tranh lớn hơn, vì thế nó mới biết các thứ đang ở đâu. Tương tự với cách trẻ con phát triển tình trạng bất biến của đồ vật để biết mọi thứ đang tồn tại, ngay cả khi chúng đã rời khỏi tầm nhìn của đứa trẻ. RNN là “tái phát”, ví dụ chúng cho phép thông tin duy trì lâu hơn. Có một đoạn video ấn tượng về một mạng Q tái phát sâu (DQRN) chơi trò Doom. Xem trong Simple Reinforcement Learning with Tensorflow của Arthur Juliani.
Năm 2016, chỉ một năm sau DQN, DeepMind lại thông báo về một thuật toán khác, gọi là Asynchronous Advantage Actor – Critic (A3C), có thể vượt qua hiệu năng tuyệt vời của các trò game Atari trong khi chỉ mất thời gian đào tạo bằng một nửa (Mnih et al, 2016). A3C là một giải thuật actor – critic kết hợp tốt nhất cả hai cách chúng ta vừa tìm hiểu trước đó: nó sử dụng một actor (một mạng qui tắc để quyết định hành động thế nào) và một critic (một mạng Q để quyết định các thứ đáng giá thế nào). Arthur Juliani có một bài viết tuyệt vời về các A3C vận hành. A3C bây giờ là Universe Starter Agent của OpenAI.

Từ đó, đã có vô số đột phá lý thú – từ việc các cỗ máy AI phát minh ra ngôn ngữ của riêng chúng cho tới việc chúng tự học cách đi vào vô vàn lãnh địa khác. Đấy mới chỉ là dạo trên bề mặt RL, hi vọng đây là điểm bắt đầu cho các khám phá lớn hơn!

Chúng tôi muốn chia sẻ đoạn video khó tin về các agent của DeepMind đã học cách đi bộ… có thêm âm thanh. Hãy cầm bắp rang bơ, bật loa lên, và chứng kiến giây phút vinh quang của trí tuệ nhân tạo:

Tài liệu để thực hành và tìm hiểu sâu hơn
Code:
-          Pong from Pixels của Andrej Karpathy sẽ giúp bạn nhanh chóng chạy được agent tăng cường đầu tiên. Như mô tả “chúng ta sẽ học cách chơi game ATARI (Pong!) bằng PG, từ đầu, với các pixel, và một mạng neuron mức sâu, và toàn bộ chỉ 130 dòng code Python có sử dụng một số hàm phụ thuộc. (Gist link)
-          Tiếp theo, chúng tôi đặc biệt khuyên đọc tài liệu Simple Reinforcement Learning with Tensorflow của Arthur Juliani. Nó bàn từ DQN, mô hình học theo qui tắc, học theo actor – critic tới các chiến lược thăm dò dùng TensorFlow. Hãy cố gắng hiểu và áp dụng các phương pháp trong đó.

Bài giảng, bài viết
-          Reinforcement Learning: An Introduction của Richard Sutton, một cuốn sách rất đáng đọc.
-          CS 294: Deep Reinforcement Learning của John Schulman (Berkeley)
-          Reinforcement Learning của David Silver (UCL)

XONG!




Vishal Maini
Samer Sabri


Chuẩn bị cho một khóa thiền Vipassana 10 ngày như thế nào?

Vì liên tục có nhiều bạn hỏi về các khóa thiền Vipassana mà mình thi thoảng tham gia, để không phải giải thích lại nhiều lần, mình viết các ...