Узнал о появлении вот такой красоты:
http://bnkorpus.info/
Цитата:Беларускі N-корпус - першая спроба стварэння публічнага агульнага корпусу беларускай мовы.
Першы варыянт корпусу мае 1945 тэкстаў (~15 млн. словаўжыванняў) мастацкай літаратуры (проза і вершы) з граматычнай разметкай і пашпартызацыяй (аўтар, назва твора і г.д.). Планаваны аб’ём корпусу – 100 млн. словаўжыванняў
Лексіка-граматычная база даступная на ўмовах ліцэнзіі Creative Commons Attribution/Share-Alike 3.0.
Рухавік будзе даступны на ўмовах ліцензіі GNU General Public License, Version 3.
Вітаецца любая дапамога: прапановы і крытычныя заўвагі, вычытаныя тэксты (з выходнымі звесткамі), дапамога ў зняцці аманіміі і інш.
Дасылайце лісты на bnkorpus@gmail.com
Іншыя корпусы беларускай мовы: корпус навуковых тэкстаў Corpus Albaruthenicum, паралельны беларуска-руска-беларускі корпус на сайце Нацыянальнага корпусу рускай мовы.
Не знаю, кто автор, но идея мненравится.
Раньше при обсуждении употребимости каких-то форм в СБЛЯ я использовал поиск по сайту knihi.com и чему-то подобному, теперь вот буду пользоваться.
Под
доступной для скачивания лексико-грамматической базой понимается набор описание словоформ:
Код:
<Paradigm pdgId="1125538" Lemma="упіва´цца" Tag="VIMR1">
<Form Tag="0">упіва´цца</Form>
<Form Tag="R1S">упіва´юся</Form>
<Form Tag="R2S">упіва´ешся</Form>
<Form Tag="R3S">упіва´ецца</Form>
<Form Tag="R1P">упіва´емся</Form>
<Form Tag="R2P">упіва´ецеся</Form>
<Form Tag="R3P">упіва´юцца</Form>
<Form Tag="PXSM">упіва´ўся</Form>
<Form Tag="PXSF">упіва´лася</Form>
<Form Tag="PXSN">упіва´лася</Form>
<Form Tag="PXPX">упіва´ліся</Form>
<Form Tag="I2S">упіва´йся</Form>
<Form Tag="I2P">упіва´йцеся</Form>
<Form Tag="RG">упіва´ючыся</Form>
</Paradigm>
Что, безусловно, весьма полезно... Но почему-то я не вижу в базе существительных, только глаголы.
Движок сайта ещё не опубликовали, ну да не так уж он и нужен.