近日,禾賽科技與Scale AI聯合發(fā)布了自動駕駛開源數據集 -- PandaSet。PandaSet采用禾賽科技先進的激光雷達進行數據采集,并通過Scale AI強大的標注平臺進行精準的數據標注,為從事自動駕駛研發(fā)的公司、機構和個人,提供了內容豐富、目標物密集的高質量免費數據。
PandaSet數據集采用2款激光雷達和6個攝像頭進行數據采集,包含超過16000幀激光雷達點云和超過48000張照片,共100多個場景。除了激光雷達點云和照片外,數據集還包含GPS(全球定位系統(tǒng))/IMU(慣性傳感器)、標定參數、標注、SDK(軟件開發(fā)工具包)等信息。
尤其值得關注的是,PandaSet數據集對100多個場景的每個場景都進行了目標檢測,共檢測28類物體;大多數場景還進行了語義分割,共37種語義標簽。目標檢測采用傳統(tǒng)的長方體標注,例如,自行車和汽車可以用長方體線框框出來。而對于激光雷達點云數據,并非每個點都隸屬于某一目標物,因此數據集還通過點云分割工具精確標注了每個點的語義標簽。如此細膩的標注,也為深度學習算法模型提供了絕佳的數據資料。
對于一個自動駕駛數據集,場景的多樣性和復雜性是衡量其優(yōu)劣程度的重要標準之一。PandaSet數據集中的所有數據均采集自舊金山的城區(qū)道路和硅谷的郊區(qū)道路,這些道路涵蓋了汽車、自行車、交通燈、行人、建筑物等各種各樣的交通信息,是對自動駕駛挑戰(zhàn)性最大的一類應用場景。此外,PandaSet數據集的數據覆蓋了白天和黑夜,也讓其具備了很強的適用性。
在數據采集中,PandaSet用于數據采集的兩款激光雷達均為業(yè)內領先產品,這兩款激光雷達由禾賽科技自主研發(fā),一款是具有圖像級分辨率的前向激光雷達PandarGT,另一款是64線機械旋轉式激光雷達Pandar64,保證采集到的點云足夠準確、清晰、細膩 -- 世界上現有的開源數據集普遍采集較早,還鮮有使用Pandar64和PandarGT這樣的高性能激光雷達來采集數據。
(美通社,2020年7月9日上海)