Создать тему  Создать ответ 
Эвристическая словарная база данных на грузинском материале. Отдельные проблемы
02-06-2019, 22:42    
Сообщение: #1
Ickander

Moderator
Сообщений: 425
Зарегистрирован: 18.08.12

Эвристическая словарная база данных на грузинском материале. Отдельные проблемы
Дабы далее не закапываться в тоннах бумажек с выписками разных замечаний по лексике грузинского, решил потешить свою горепрограммистскость созданием электронной базы данных для складывания этого всего в незанимающем полки и папки виде.

С примерами и структурой ЭБД, обслуживающих словарные дела, не знаком, потому при проектировании опирался на свои представления о словарных картотеках, устройстве викисловаря, различных электронных корпусах (только в пользовательском их представлении) и том "как это мне надо". Ну и на могучую богиню Эврику.

Ненулева вероятность, что на форуме кто-то общался с подобными или околоподобными вещами, имеет любительские представления о лексике и СУБД, возможно, одновременно. Я даже знаю что вероятность таки равна единице, но не факт что эти форумчане сами в курсе.

Потому решил ниже выложить свои эскизы и почать обсуждалище и критицилище.
Найти все сообщения
Цитировать это сообщение
02-06-2019, 23:09    
Сообщение: #2
Ickander

Moderator
Сообщений: 425
Зарегистрирован: 18.08.12

RE: Эвристическая словарная база данных на грузинском материале. Отдельные проблемы
И собственно прикладываю диаграмму БД.

Я выделил следующие сущности основные:

лемма

форма: связана с леммой и только с одной, с одной леммой может быть связано много форм, ну это понятно - падежи, лица, числа, наклонения...

значение: просто русское описание некоторого лексического значения, значения связаны с леммами отношением многие ко многим, причём со строками служебной таблицы, увязывающей значения и леммы, связаны через ещё одну таблицу отрывки, также многие ко многим.

отрывки: они же выписки, они же примеры употребления, они же иллюстративный материал - ну собственно живые письменные примеры речи, связаны, помимо вышеозвученного, с формами отношением многие ко многим.

Это костяк базы, остальные таблицы более служебные по назначению, но с ними и их употреблением у меня есть некоторые сомнения также.

Сомнение номер один:
Я порешил выносить в отдельные леммы не только причастные формы, но и масдары также. Следует ли для этого создавать отдельные подкатегории в категориях "существительное" и "прилагательное", да и как отнести иные причастия к именам существительным или прилагательным... Как аккуратно сделать ссылки между леммой глаголом и леммами отглагольными именами... вот такое вот.


Прикрепления
.pdf  documentDB2.pdf (Размер: 80.64 Кб / Загрузок: 193)
Найти все сообщения
Цитировать это сообщение
08-06-2019, 00:12    
Сообщение: #3
Ickander

Moderator
Сообщений: 425
Зарегистрирован: 18.08.12

RE: Эвристическая словарная база данных на грузинском материале. Отдельные проблемы
Порешил, что причастие технически будет отдельной частью речи. Сами грузины не отличают их от имён, не отвечая, правда, на вопрос существительное это или прилагательное, потому как оно может как обозначать самого агента/пациента, так и обозначать признак некоего субстантива, как его сущность агентом/пациентом.

Подкатегории причастий это собственно четыре кластера (активное, настоящее пассивное, будущее, прошедшее пассивное).

Масдар тогда тоже стоит сделать частью речи технически.

Если искать по части речи, масдары однозначно включать в существительные, а вот причастия... не знаю...

Ну и у леммы появляются ссылки на другую лемму:

id леммы глагола видовой пары
и
id леммы глагола, от которого произведено данное имя
Найти все сообщения
Цитировать это сообщение
Создать ответ 


Переход:


Пользователи просматривают эту тему: 1 Гость(ей)