Projektowanie metadanych w korpusie tekstów polskich do 1500 roku – wielopoziomowa struktura informacji

Autor

DOI:

https://doi.org/10.31261/FL.2020.07.05

Słowa kluczowe:

language corpus, metadata, text, glosses, 13th–15th century

Abstrakt

The subject of research are selected metadata that should characterize the texts collected in the corpus of the oldest attestations of the Polish language. The author of the article compares and analyses the factors affecting the development of the basic data structure used in synchronic and diachronic corpora (author, title, date of the text, text channel, text classification, source of citation). Without those factors taken into account the disambiguation of the object in the database becomes impossible, and the use of grammatical information is unreliable and impractical. The result of the presented analysis is a proposal to extend the level of description for individual markers.

Bibliografia

Źródła

KorBa – Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) [online: https://korba.edu.pl/query_corpus/; data dostępu: 7.10.2019].

Korpus polszczyzny 1830–1918 [online: http://www.f19.uw.edu.pl/; data dostępu: 7.10.2019].

Korpus polszczyzny XVI wieku [online: http://spxvi.edu.pl/korpus/; data dostępu: 7.10.2019].

Korpus tekstów staropolskich [online: https://ijp.pan.pl/publikacje-i-materialy/zasoby/korpus-tekstowstaropolskich/; data dostępu: 7.10.2019].

NKJP – Narodowy Korpus Języka Polskiego [online: http://nkjp.pl/; data dostępu: 7.10.2019].

OźSstp 2005 – Twardzik W., red. we współpracy z E. Deptuchową i L. Szelachowską-Winiarzową. Oprac. Belcarzowa E., Deptuchowa E., Frodyma M., Kalicka K., Leńczuk M., Szelachowska-Winiarzowa L., Wójcikowa Z., 2005: Opis źródeł Słownika staropolskiego. Kraków.

Słowniki

SJP PWN – Słownik języka polskiego PWN, 2019 [online: https://sjp.pwn.pl/; data dostępu: 7.10.2019].

WSJP PAN – Żmigrodzki P., red., 2008: Wielki słownik języka polskiego PAN [online: https://wsjp.pl/index.php?pwh=0; data dostępu: 7.10.2019].

Literatura

Bracha K., 2007: Nauczanie kaznodziejskie w Polsce późnego średniowiecza. Sermones dominicales et festivales z tzw. kolekcji Piotra z Miłosławia. Kielce.

Gruszczyński W., Adamiec D., Ogrodniczuk M., 2013: Elektroniczny korpus tekstów polskich z XVII i XVIII wieku (do 1772 r.) – prezentacja projektu badawczego. „Polonica” XXXIII, s. 309–316.

Gruszczyński W., Bronikowska R., 2018: Tworzenie korpusu tekstów dawnych a korpusu tekstów współczesnych: różnice teoretyczne i warsztatowe (na przykładzie Korpusu tekstów polskich XVII–XVIII wieku) [online: https://korba.edu.pl/static/documents/publikacje/2015_gruszczynski_bronikowska.pdf; data dostępu: 7.10.2019].

Klapper M., Kołodziej D., 2015: Elektroniczny Tezaurus Rozproszonego Słownictwa Staropolskiego do 1500 roku. Perspektywy i problemy. „Polonica” XXXV, s. 87–101.

Kołodziej D., Klapper M., 2014: Elektroniczny Korpus Tekstów Staropolskich do 1500 r. Perspektywy i problemy. „Prace Filologiczne” LXV, s. 203–212.

Król i in., 2019: Król M., Derwojedowa M., Górski R.L., Gruszczyński W., Opaliński K.W., Potoniec P., Woliński M., Kieraś W., Eder M.: Narodowy Korpus Diachroniczny Polszczyzny. Projekt. „Język Polski” XCIX, z. 1, s. 92–101.

Przepiórkowski i in., 2012: Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B., red.: Narodowy Korpus Języka Polskiego. Warszawa.

Wolny J., 1961: Łaciński zbiór kazań Peregryna z Opola i ich związki z tzw. „Kazaniami gnieźnieńskimi”. W: Lewański J., red.: Średniowiecze. Studia o kulturze. T. 1. Warszawa, s. 171–238.

Wydra W., Rzepka W.R., 2004: Chrestomatia staropolska. Teksty do roku 1543. Wyd. III. Wrocław.

Pobrania

Opublikowane

2020-11-20

Jak cytować

Leńczuk, M. (2020). Projektowanie metadanych w korpusie tekstów polskich do 1500 roku – wielopoziomowa struktura informacji. Forum Lingwistyczne, 7(7), 59–69. https://doi.org/10.31261/FL.2020.07.05