致力于計算機視覺、機器人與各類智能技術交叉融合,故命名為 “視覺機器人與智能技術”實驗室,但 “視覺機器人” 一詞暫無嚴格的學術...
計算攝影是利用數字計算結合傳感器及光學等技術創造出新型攝影設備以及相關應用的綜合技術。 智能終端計算攝影系統可通過成像控制、圖...
研究面向真實世界和數字世界的具身智能體(計算攝影機器人)和軟件智能體,核心模塊:感知與觀測,記憶與檢索,推理與規劃,行動與執行...
實驗室獲視覺頂會CVPR RHOBIN 2025 人物交互重建: 5冠2亞
CCF-A國際多媒體頂會ACM MM2024,多模態人體動捕挑戰賽,三個冠軍:單目視頻動捕賽道、視頻+慣性動捕賽道、慣性動捕賽道。...
實驗室獲視覺頂會CVPR RHOBIN 2024 人物交互重建:賽道1 (亞軍)/賽道3 (冠軍)/賽道5 (第4)
實驗室牽頭獲CVPR NTIRE 2024 AIGC質量評價—圖像賽道 (冠軍) / 視頻賽道 (第5)!
實驗室組織1個本科生牽頭的隊伍參加了CVPR NTIRE 2024 Short-form 視頻質量評估比賽,獲得前十 (第9)!...
Quality Assessment of Video Enhancement Challenge:實驗室應邀參與了淘寶音視頻技術的參賽隊伍「TB-VQA」,2020級碩士生肖鵬翔作為...
已簽約機械工業出版社,預計2023年出版。這是《移動機器人開發技術(激光SLAM版)》的姊妹篇,希望有助于同行們培養初步掌握移動機器人...
2022年機械工業出版社出版(第一版),這是一本凝聚實驗室人才培養經驗的教材,希望有助于同行們培養初步掌握移動機器人開發技術的學生...
"Metadata for image aesthetics assessment with aesthetic attributes in mobile terminal computational photography system"...
Multi-camera data collection and annotation for AWB enhancement in mobile terminal computational photography system...
Reference architecture for mobile terminal computational photography system...
顏色是視覺信息中最為基礎也最為直接的特征之一,但顏色特征也是一種極不穩定的視覺特征,很容易受到光照顏色變化的影響,顏色恒常性計...
牛津詞典將美學定義為:“concerned with beauty and art and the understanding of beautiful things, and made in an artistic way a...
圖像美學攝制 (Aesthetic Shooting/Generating) 是以人為中心的計算攝影關鍵技術,主要研究知識與數據雙輪驅動的攝制,人體動作捕捉,...
研究面向自動攝影的具身智能體,包括開放世界物體感知、物理世界數字孿生、知識與數據驅動的推理與決策、基于強化學習的攝影執行、記憶...
打造視覺審查智能體平臺,從圖像看得清、看得懂到視頻看得透,實現從圖像目標感知到視頻時空理解的跨越。
研究在嵌入式平臺將基于視覺計算的可行域與障礙物檢測、BEV感知與避障等算法落地。
面向工業需求,開展“計算攝影應用落地”的研發。
受企業委托,研發單目視頻動作捕捉與渲染系統并上線運營,實現低成本、快速、高質量捕捉動作并綁定為虛擬人,各類指標應領先于國內外同...
面向視頻監控場景,根據6個質量指標(清晰度、噪聲、對比度、亮度、色彩還原、色彩飽和度),分別采用不同的計算方法來對測試素材進行...
采用聯合研發工作組的方式,研究動作運動韻律增強方法,通過高質量、低成本的動作節奏數據集標注,提出了適合提取舞蹈動作特征的深度學...
在疫情期間,家庭健身已成為一個顯著的趨勢,并獲得了廣泛關注。然而,現有的健身助手系統主要遵循傳統“命令-輸出”交互模型,其輸出...
視覺機器人與智能技術實驗室自主設計、完全開源的mRobotit移動機器人平臺,主要面向教學和學習場景,具有成本低、結構精簡等特點,平臺...
采用聯合開發工作組的組織方式,打造智能制造系統,包括:智能制造及衍生平臺標準化設計與整體規劃、設備和軟件選型、軟件及算法研發、...
社區媒體是融入社區場景中,形成網絡化布局,精準到家的生活圈媒體。作為居民每天必經的生活場景,社區的媒體價值正在逐漸受到關注。拉...
本項目針對傳統的“靜態展示、說教式傳播”的博物館展示形式,難以滿足現代參觀者及歷史文化傳播的需求問題,研發面向博物館藏品虛實融...
預研圖書盤點機器人,總體結構共有九個模塊,分別為人機交互模塊、建圖與定位模塊、條碼識別模塊、通信模塊、避障模塊、盤點數據管理模...
基于大模型與知識圖譜技術,采用聯合開發工作組的組織方式,打造智慧機構服務系統、居家照護,數字化監控平臺、自動化設備為一體的智慧...
深圳市泰衡諾科技有限公司由深圳傳音控股投資組建,是深圳傳音控股的全資研發子公司。聯合實驗室以計算攝影的相關研究作為工作重點。
以語音識別等技術為主的兒童陪伴機器人,陪伴兒童成長,結合寓教于樂的故事素材,提供趣味聊天。
主要研究領域為:1、深度視覺傳感器技術;2、基于激光雷達/視覺傳感器的SLAM技術;3、地圖多分辨率分割、路徑規劃、避障等導航技術;4...
基于深度學習的遠距離人臉識別 / 陌生人檢測技術在嵌入式智能門禁系統中的應用。
2D視覺測距傳感器,激光輔助標定。
包括:語義分割/分層、筆觸模擬、紋理合成、圖像矢量化、場景理解等。繪畫機器人技術是機器視覺、繪畫藝術、新型顯示與印刷技術和認知...