統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院 報(bào)道
近日,我校統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院博士生任陽(yáng)完成的學(xué)術(shù)論文“Spectral Clustering for Functional Data with Asymptotic Properties”以南京審計(jì)大學(xué)為第一署名單位被統(tǒng)計(jì)學(xué)權(quán)威期刊Statistica Sinica接收。論文指導(dǎo)教師為我校統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院林金官教授,王江艷副教授與加拿大滑鐵盧大學(xué)桑培俊副教授。

傳統(tǒng)聚類方法主要是針對(duì)多元數(shù)據(jù)開(kāi)發(fā)的,往往難以捕捉函數(shù)型數(shù)據(jù)的連續(xù)性與動(dòng)態(tài)性,進(jìn)而忽略了關(guān)鍵特征。針對(duì)這一問(wèn)題,該論文提出一種兩階段函數(shù)型數(shù)據(jù)譜聚類(TSFDSC)方法,該方法可借助圖拉普拉斯算子,有效實(shí)現(xiàn)對(duì)稠密型和稀疏型函數(shù)數(shù)據(jù)的聚類。對(duì)于稠密函數(shù)型數(shù)據(jù),先將其投影至一組預(yù)設(shè)的基函數(shù)上,再對(duì)投影得到的系數(shù)進(jìn)行譜聚類;對(duì)于稀疏函數(shù)型數(shù)據(jù),則改用函數(shù)主成分得分開(kāi)展聚類。通過(guò)利用譜嵌入生成的低維表征,該方法實(shí)現(xiàn)了計(jì)算效率的提升。論文推導(dǎo)并證明了所提方法的漸近性質(zhì)。仿真實(shí)驗(yàn)結(jié)果表明,在多種實(shí)驗(yàn)設(shè)定下,TSFDSC的性能均優(yōu)于一些常用的函數(shù)型聚類方法。最后,通過(guò)兩個(gè)實(shí)際應(yīng)用案例,進(jìn)一步驗(yàn)證了該方法的有效性。











