講座報(bào)告主題:生物啟發(fā)的具身聽(tīng)覺(jué)——框架和實(shí)踐
專(zhuān)家姓名:付強(qiáng)
日期:2025-11-25 時(shí)間:10:00
地點(diǎn):計(jì)算機(jī)學(xué)院208報(bào)告廳
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院
主講簡(jiǎn)介:付強(qiáng),博?,研究員,之江實(shí)驗(yàn)室?級(jí)研究專(zhuān)家、浙江大學(xué)兼任研究員。博?畢業(yè)于?安電?科技?學(xué),并分別在美國(guó)OGI?語(yǔ)中?、愛(ài)爾蘭Limerick?學(xué)從事博?后工作。曾任阿?巴巴達(dá)摩院研究員、中科院聲學(xué)所研究員,并曾創(chuàng)辦北京先聲互聯(lián)科技有限公司,后被阿?巴巴全資收購(gòu)。研究專(zhuān)長(zhǎng):?期從事語(yǔ)?處理、機(jī)器聽(tīng)覺(jué)和多模態(tài)端側(cè) AI相關(guān)的研究和應(yīng)?,具有豐富的產(chǎn)學(xué)研?體化經(jīng)驗(yàn)。
主講內(nèi)容簡(jiǎn)介:本報(bào)告圍繞“生物啟發(fā)的具身聽(tīng)覺(jué)”展開(kāi),提出了一種融合還原論與功能主義的機(jī)器聽(tīng)覺(jué)新路徑,強(qiáng)調(diào)感知-認(rèn)知-行為閉環(huán)的具身性。通過(guò)多模態(tài)信息融合、聽(tīng)覺(jué)注意力機(jī)制(如“雞尾酒會(huì)”效應(yīng))和自主任務(wù)驅(qū)動(dòng),構(gòu)建了貫通硬件與算法的計(jì)算框架。實(shí)踐部分涵蓋智能語(yǔ)音交互(如機(jī)器人語(yǔ)音前端處理、噪聲環(huán)境下的聲紋識(shí)別)與海洋聲景建模(基于音頻大模型的鯨魚(yú)與船舶聲音識(shí)別),體現(xiàn)了生物啟發(fā)機(jī)制在復(fù)雜環(huán)境中的魯棒性與適應(yīng)性。研究強(qiáng)調(diào)聯(lián)合優(yōu)化與跨模態(tài)對(duì)齊,推動(dòng)機(jī)器聽(tīng)覺(jué)向更智能、具身化的方向發(fā)展。
歡迎師生參加!