LAP Lambert Academic Publishing ( 2011-07-24 )
€ 68,00
Создание большой базы данных, работающей с внешнимиисточниками информации, сопряжено с рядом сложностей. Одна из них- ошибки оператоского ввода. Достаточно одной опечатки принаборе номера страховки, неправильно расслышаной фамилии, небрежности принаборе адреса - и нужная запись не будет найдена, или в базе появится двезаписи вместо одной. Следствием может быть неоплаченое лечение,неоправданно выданый кредит, ошибка при распределении мест в ВУЗы. СовременныеСУБД не предоставляют инструментов для работы с похожими, но не строгоравными, значениями.В работе предлагается считать похожими строки,расстояние Левенштейна между которыми не превышает некоторого пороговогозначения. Рассмотрено расширение реляционной алгебры, порожденноеоперациями нестрогого соединения, объединения, разности. Рассматриваютсяалгоритмы выполнения нестрогих реляционных операций, основанные наприменении некоторых методов поиска по сходству. Приводится описание программногообеспечения, реализующего прокси-уровень между клиентскойпрограммой и СУБД Oracle.Выполнен анализ скорости работы алгоритмов,количества ошибок первого и второго рода в отождествлении записей.
Book Details: |
|
ISBN-13: |
978-3-8443-5679-3 |
ISBN-10: |
3844356797 |
EAN: |
9783844356793 |
Book language: |
Russian |
By (author) : |
Галина Олеговна Федоркова |
Number of pages: |
168 |
Published on: |
2011-07-24 |
Category: |
Informatics, IT |