База слов под NG Pro

Статус
В этой теме нельзя размещать новые ответы.

AdeQuAte

Профессор
Регистрация
23 Мар 2007
Сообщения
353
Реакции
47
Поделитесь базой слов под NG Pro.
Нашёл тут на форуме, но там разделяются слова не теми символами..
 
А каким образом можно поправить базу которая выглядит следующим образом:
слово|слово2|слово3
а нужно сделать
слово=слово2|слово3
 
к примеру регулярным выражением
PHP:
$file = file('basa_slov.txt');
$basa = @implode("", $file);
echo preg_replace('/(.*)\|(.*)\|(.*)$/im',"$1=$2|$3",$basa);
 
Нефурычит) Обратно в файл не пишет. И ещё один момент.. слов в каждой строке разное количество.
 
я тебе показал пример, дальше сам мог бы доделать..
к примеру вывод в файл можешь сделать так
PHP:
$file = file('basa_slov.txt'); 
$basa = @implode("", $file);
file_put_contents( 'basa_slov.txt', preg_replace('/(.*)\|(.*)\|(.*)$/im',"$1=$2|$3",$basa));
а вот регулярное выражение доделывай под свой формат уже как-нибудь сам
 
если словарь именно такого вида, а не другой, просто меняй первое вхождение | на =. Рег будет такой:
/([^\|]+)\|/s
меняй на
\\1=
модификаторы сам ставь. ну полнотекст полюбому
 
Крут) Мне уже на дельфи сделали. Да вот проблемы это не решает. Если тупо взять словарь синонимов, то текст будет не читаемый. Нужно перечитывать и править весь словарь. За два часа переделал 9% словаря. Чувствую себя Ожиговым или Абрамовым :D
 
Вот словарик 5200 слов. Есть дубли. Почистил первые 9% словаря. слова разделяются знаком "="
Юзайте ;)
 

Вложения

  • base.txt
    103,7 KB · Просмотры: 47
А чего дубли не убрал? Порви по = , собери в массив и сделай array_unique.

Ну и то, что по одному синониму для слова плохо. Если в тексте будет вхождение 10 раз хотя бы и всего один синоним. Вобщем не для человека текст будет.
 
Я бы сделал, да в PHP шарю на уровне "вырезать ненужный кусок"
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху