Leiden Weibo corpus

Student brengt Chinese taalvariatie in beeld | Nieuws

Student brengt Chinese taalvariatie in beeld | Nieuws | Taalwetenschappen, Geesteswetenschappen | china, dialecten, sociale media, taalvariatie, twitter, chinees, cloud computing, corpus – Kennislink.

“Natuurlijk had ik wel gelezen dat ze in elk dorpje anders praten, maar tijdens die reis merkte ik het pas echt”, vertelt Van Esch. “In de Verenigde staten bestaat er een Twittercorpus waar dialectwoorden en hun plaats van herkomst in zijn opgenomen. Toen dacht ik: dat kan ik ook!” Dat is het Leiden Weibo Corpus [1] geworden. Weibo is de Chinese variant van Twitter waar ruim 300 miljoen Chinezen een account hebben. Eencorpus [2] is een grote verzameling taalmateriaal die zo gestructureerd is dat de gebruiker er makkelijk in kan zoeken.

Weibo is de Chinese variant van Twitter waar ruim 300 miljoen Chinezen een account hebben. Trowbridge Estate

 

 

Bron: Publicatie Universiteit Leiden – www.kennislink.nl