Thay vì dựa trên hàng trăm nghìn dòng mã, giống như tất cả các phiên bản trước của phần mềm tự lái, hệ thống mới này đã tự dạy cách lái xe bằng cách xử lý hàng tỷ khung hình video về cách con người thực hiện điều đó, giống như hệ thống lớn mới. Các chatbot mô hình ngôn ngữ tự đào tạo để tạo ra câu trả lời bằng cách xử lý hàng tỷ từ trong văn bản của con người.
Điều đáng nói là Musk đã đưa Tesla vào phương pháp tiếp cận cơ bản mới này chỉ 8 tháng trước đó.
“Nó giống như ChatGPT, nhưng nó dành cho ô tô”, Dhaval Shroff, một thành viên trẻ trong nhóm phát triển hệ thống lái tự động của Tesla, giải thích với Musk trong một cuộc họp vào tháng 12/2022. Dhaval Shroff đã so sánh ý tưởng mà họ đang thực hiện với chatbot vừa được OpenAI, phòng thí nghiệm mà Musk đồng sáng lập vào năm 2015, phát hành.
“Chúng tôi xử lý một lượng dữ liệu khổng lồ về cách người lái xe thực sự hành động trong một tình huống lái xe phức tạp”, cho Shroff biết. “Sau đó chúng tôi huấn luyện mạng lưới thần kinh của máy tính để bắt chước điều đó”.
Cho đến lúc đó, hệ thống Autopilot của Tesla vẫn dựa vào cách tiếp cận dựa trên quy tắc trước đó. Camera của ô tô đã xác định những thứ như vạch kẻ làn đường, người đi bộ, phương tiện, biển báo và tín hiệu giao thông. Sau đó, phần mềm áp dụng một bộ quy tắc, chẳng hạn như: Dừng khi đèn đỏ, đi khi đèn xanh, đi giữa vạch kẻ làn đường, chỉ đi qua giao lộ khi không có xe nào chạy tới đủ nhanh để tông vào bạn. Các kỹ sư của Tesla đã viết và cập nhật hàng trăm nghìn dòng mã C++ theo cách thủ công để áp dụng các quy tắc này cho các tình huống phức tạp.
“Công cụ lập kế hoạch mạng lưới thần kinh” mà Shroff và những người khác đang nghiên cứu đã áp dụng một cách tiếp cận khác. Shroff nói: “Thay vì xác định đường đi thích hợp của ô tô dựa trên các quy tắc, chúng tôi xác định đường đi thích hợp của ô tô bằng cách dựa vào mạng lưới thần kinh học hỏi từ hàng triệu ví dụ về những gì con người đã làm”.
Nói cách khác, đó là sự bắt chước từ con người. Đối mặt với một tình huống, mạng lưới thần kinh chọn con đường dựa trên những gì con người đã làm trong hàng nghìn tình huống tương tự. Nó giống như cách con người học nói, lái xe, chơi cờ, ăn mì spaghetti và làm hầu hết mọi thứ khác, chúng ta có thể được đưa ra một bộ quy tắc để tuân theo, nhưng chủ yếu chúng ta tiếp thu các kỹ năng bằng cách quan sát cách người khác thực hiện chúng. Đó là cách tiếp cận học máy được Alan Turing hình dung trong bài báo năm 1950 của ông.
Đến đầu năm 2023, dự án quy hoạch mạng lưới thần kinh đã phân tích 10 triệu clip video được thu thập từ ô tô của khách hàng Tesla. Phải chăng điều đó có nghĩa là nó chỉ hoạt động tốt như mức trung bình của những người lái xe?
“Không, bởi vì chúng tôi chỉ sử dụng dữ liệu từ con người khi họ xử lý tốt một tình huống”, Shroff giải thích. Những người được gắn nhãn là con người, nhiều người trong số họ có trụ sở tại Buffalo, New York, đã đánh giá các video và cho điểm chúng. Musk bảo họ hãy tìm kiếm những thứ mà “tài xế Uber 5 sao sẽ làm” và đó là những video được sử dụng để đào tạo máy tính.
Musk thường xuyên đi qua không gian làm việc của Autopilot ở Palo Alto và ngồi xuống cạnh các kỹ sư để thảo luận ngẫu hứng. Khi nghiên cứu phương pháp bắt chước con người mới, Musk đã đặt câu hỏi: Nó có thực sự cần thiết không? Có lẽ nó hơi quá mức cần thiết? Việc sử dụng mạng lưới thần kinh có phức tạp không cần thiết không?
Shroff đã chỉ cho Musk những trường hợp trong đó công cụ lập kế hoạch mạng lưới thần kinh sẽ hoạt động tốt hơn.
Bản demo có một con đường rải đầy thùng rác, nón giao thông rơi và các mảnh vụn ngẫu nhiên. Một chiếc ô tô được điều khiển bởi người lập kế hoạch mạng lưới thần kinh có thể chạy vòng quanh các chướng ngại vật, vượt qua làn đường và vi phạm một số quy tắc nếu cần thiết. Shroff nói: “Đây là những gì xảy ra khi chúng tôi chuyển từ dựa trên quy tắc sang dựa trên đường dẫn mạng. Chiếc xe sẽ không bao giờ bị va chạm nếu bạn bật thứ này lên, ngay cả trong những môi trường không có cấu trúc”.
Đó là kiểu nhảy vọt vào tương lai khiến Musk phấn khích. “Chúng ta nên thực hiện một màn trình diễn theo phong cách James Bond”, Musk nói. “Trong đó có bom nổ tứ phía và một UFO đang rơi từ trên trời xuống trong khi chiếc ô tô lao qua mà không va vào bất cứ thứ gì”.
Các hệ thống học máy thường cần một thước đo hướng dẫn chúng khi chúng tự đào tạo. Musk người thích quản lý bằng cách ra quyết định những số liệu nào là tối quan trọng, đã đưa cho họ kim chỉ nam: Số km mà những chiếc ô tô có hệ thống tự lái hoàn toàn có thể đi được mà không cần sự can thiệp của con người.
“Tôi muốn dữ liệu mới nhất về số dặm trên mỗi lần can thiệp sẽ là trang trình bày bắt đầu tại mỗi cuộc họp của chúng ta”, Musk ra quyết định. Musk bảo họ hãy biến nó giống như một trò chơi điện tử nơi họ có thể xem điểm của mình mỗi ngày.
Các thành viên của nhóm đã lắp đặt các màn hình tivi lớn 85 inch trong không gian làm việc của họ để hiển thị theo thời gian thực số km mà xe FSD đã đi trung bình mà không cần can thiệp. Họ đặt một chiếc cồng gần bàn làm việc của mình và bất cứ khi nào họ giải quyết thành công một vấn đề cần can thiệp, họ phải đánh chiếc cồng.
Đến giữa tháng 4 năm 2023, đã đến lúc Musk đích thân thử nghiệm công cụ lập kế hoạch mạng lưới thần kinh mới. Musk ngồi ở ghế lái cạnh Ashok Elluswamy, giám đốc phần mềm Autopilot của Tesla. Ba thành viên của đội Autopilot ở phía sau. Khi họ chuẩn bị rời bãi đậu xe tại khu phức hợp văn phòng Palo Alto của Tesla, Musk đã chọn một vị trí trên bản đồ để ô tô đi và bỏ tay ra khỏi vô lăng.
Khi ô tô rẽ vào đường chính, thử thách đáng sợ đầu tiên nảy sinh: một người đi xe đạp đang lao tới. Tự nó, chiếc xe đã dừng tránh, giống như con người đã làm.
Trong 25 phút, chiếc xe chạy trên những con đường nhanh và đường lân cận, xử lý những khúc cua phức tạp và tránh người đi xe đạp, người đi bộ và vật nuôi. Musk chưa bao giờ chạm vào vô lăng. Chỉ một vài lần Musk can thiệp bằng cách nhấn ga khi cho rằng chiếc xe đang quá thận trọng, chẳng hạn như khi nó quá “cẩn thận” trước biển báo dừng bốn chiều. Tại một thời điểm, chiếc xe đã thực hiện một động tác mà Musk nghĩ là tốt hơn những gì anh ấy có thể làm. Musk nói, “ngay cả mạng lưới thần kinh con người của tôi cũng bị lỗi ở đây, nhưng chiếc ô tô đã làm đúng”.
Trong cuộc thảo luận, Musk đã nắm bắt được một thực tế quan trọng mà nhóm đã phát hiện ra: Mạng lưới thần kinh không hoạt động tốt cho đến khi nó được huấn luyện trên ít nhất một triệu video clip. Điều này mang lại cho Tesla lợi thế lớn so với các công ty xe hơi và AI khác. Hãng có một đội gần 2 triệu chiếc Tesla trên khắp thế giới thu thập các video clip mỗi ngày. Elluswamy nói tại cuộc họp: “Chúng tôi có vị thế đặc biệt để làm điều này”.
Bốn tháng sau, hệ thống mới đã sẵn sàng thay thế phương pháp cũ và trở thành nền tảng của FSD 12, nền tảng mà Tesla dự định phát hành ngay khi các cơ quan quản lý phê duyệt. Tuy nhiên, vẫn còn một vấn đề cần khắc phục đó là những người lái xe, ngay cả những người giỏi nhất, thường vi phạm luật giao thông và FSD mới, theo thiết kế, bắt chước những gì con người làm. Ví dụ, hơn 95% con người đi chậm qua các biển báo dừng thay vì dừng lại hoàn toàn. Người đứng đầu Ủy ban An toàn Đường cao tốc Quốc gia cho biết cơ quan này hiện đang nghiên cứu xem liệu điều đó có được phép áp dụng cho xe tự lái hay không.