“Natuurlijk had ik wel gelezen dat ze in elk dorpje anders praten, maar tijdens die reis merkte ik het pas echt”, vertelt Van Esch. “In de Verenigde staten bestaat er een Twittercorpus waar dialectwoorden en hun plaats van herkomst in zijn opgenomen. Toen dacht ik: dat kan ik ook!” Dat is het Leiden Weibo Corpus [1] geworden. Weibo is de Chinese variant van Twitter waar ruim 300 miljoen Chinezen een account hebben. Eencorpus [2] is een grote verzameling taalmateriaal die zo gestructureerd is dat de gebruiker er makkelijk in kan zoeken.
Bron: Publicatie Universiteit Leiden – www.kennislink.nl