Ana Akış

50,000× Gerçek Zamanında Sürücü AI Eğitimi

Ben Snyder25 Mart 2026, 22:00spectrum.ieee.org Kaynağa git

Bu, General Motors tarafından sunulan sponsorlu bir makaledir. Otonom sürüş, fiziksel yapay zekanın en zorlu problemlerinden biridir. Otomatik bir sistem, kaotik ve sürekli değişen bir dünyayı gerçek zamanlı olarak yorumlamalıdır; belirsizlikle başa çıkmalı, insan davranışını tahmin etmeli ve geniş bir ortam ve uç durumlar yelpazesinde güvenli bir şekilde çalışmalıdır. General Motors'ta bu probleme basit bir öncül ile yaklaşıyoruz: yolda çoğu an öngörülebilirken, nadir, belirsiz ve beklenmedik olaylar - uzun kuyruk - nihayetinde bir otonom sistemin güvenli, güvenilir ve ölçekli olarak dağıtıma hazır olup olmadığını tanımlar. (Not: Burada, tam genel otonomi için gereken uzun kuyruk sorununu çözmek üzere araştırma ve gelişen teknolojileri tartışırken, günlük otonom sürüşün %99'unu çözme konusundaki mevcut yaklaşımımızı da derinlemesine ele alıyoruz.) GM, gözlerden uzak otoyol sürüşüne ve nihayetinde tamamen otonom araçlara doğru ilerlerken, uzun kuyruğu çözmek merkezi mühendislik zorluğu haline geliyor. Bu, en beklenmedik koşullarda mantıklı davranabilecek sistemler geliştirmeyi gerektiriyor. GM, bu zorluğu karşılamak için ölçeklenebilir sürüş yapay zekası inşa ediyor - otonom sistemleri, gerçek dünyada tek başına imkansız olacak bir ölçek ve hızda eğitmek için büyük ölçekli simülasyon, pekiştirme öğrenimi ve temel model tabanlı akıl yürütmeyi birleştiriyor. Uzun kuyruk için stres testi Otonom sürüşün uzun kuyruk senaryoları birkaç çeşitte gelir. Bazıları nadirlikleriyle dikkat çeker. Yolda bir yatak var. Bir yangın musluğu patlıyor. San Francisco'da trafik ışıklarını devre dışı bırakan büyük bir elektrik kesintisi, sürücüsüz araçların daha önce hiç deneyimlemediği zorluklarla başa çıkmasını gerektiriyordu. Bu nadir sistem düzeyindeki etkileşimler, özellikle yoğun kentsel ortamlarda, beklenmedik uç durumların nasıl ölçeklenebileceğini gösteriyor. Ancak uzun kuyruk zorlukları sadece bir ömürde bir kez karşılaşılan nadir olaylardan oluşmaz. Ayrıca, karakteristik olarak insana özgü nezaket veya sağduyu gerektiren günlük senaryolar olarak da ortaya çıkar. Kalabalık bir otoparkta trafiği engellemeden bir yer için nasıl sıraya girersiniz? Ya da işaret eden işçiler ve geçici tabelalarla yönlendirilerek bir inşaat alanında nasıl yol alırsınız? Bunlar bir insan sürücü için basit zorluklardır, ancak bir makinenin kusursuz bir şekilde başa çıkabilmesi için yaratıcı mühendislik gerektirir. Otonom sürüş senaryosu talep eğrisi Görsel dil modellerinin uygulanması GM'nin bu ince senaryolarla başa çıkmak için geliştirdiği bir araç, Görsel Dil Eylem (VLA) modellerinin kullanımıdır. İnternet ölçeğinde bilgi kullanarak görüntüleri anlamlandıran standart bir Görsel Dil Modeli ile başlayan GM mühendisleri, belirli sürüşle ilgili görevler için ince ayar yapmak üzere özel kodlama başlıkları kullanıyor. Ortaya çıkan VLA, araç hareketlerini anlamlandırabilir ve genel görüntü tanıma yeteneklerinin yanı sıra 3D nesneleri tespit edebilir. Bu ayarlanmış modeller, bir aracın bir polis memurunun el hareketinin kırmızı trafik ışığını geçersiz kıldığını tanımasını veya yoğun bir havaalanı terminalindeki "yükleme alanı"nın nasıl görünebileceğini belirlemesini sağlar. Bu modeller ayrıca mühendislerin ve güvenlik operatörlerinin bir manevranın neden gerçekleştiğini anlamalarına yardımcı olan akıl yürütme izleri üretebilir - hata ayıklama, doğrulama ve güven için önemli bir araçtır. Yüksek kaliteli simülasyonlarda tehlikeli senaryoları test etme Sorun şu ki: sürüş, anlık tepki süreleri gerektirir, bu nedenle herhangi bir fazla gecikme özellikle kritik bir sorun oluşturur. Bunu çözmek için GM, "Çift Frekanslı VLA" geliştiriyor. Bu büyük ölçekli model, yüksek düzeyde anlamsal kararlar almak için daha düşük bir frekansta çalışırken ("Yolda o nesne bir dal mı yoksa bir tuğla mı?"), daha küçük, son derece verimli bir model, anlık, yüksek frekanslı mekansal kontrolü (direksiyon ve frenleme) yönetir. Bu hibrit yaklaşım, aracın güvenli sürüş için gereken anlık tepki sürelerinden ödün vermeden derin anlamsal akıl yürütmeden faydalanmasını sağlar. Ancak bir uç durumla güvenli bir şekilde başa çıkmak, modelin sadece neye baktığını anlamasını değil, aynı zamanda tanımladığı zorluğun üstesinden mantıklı bir şekilde nasıl geleceğini de anlamasını gerektirir. Bunun için deneyimden daha iyi bir alternatif yoktur. Bu nedenle, her gün, milyonlarca yüksek kaliteli kapalı döngü simülasyonu gerçekleştiriyoruz;