Какой рейтинг вас больше интересует?
|
Главная / Главные темы / Тэг «ista»
Что такое уникальность текста и как ее проверить? 2011-05-15 16:24:28
< ...
+ развернуть текст сохранённая копия
(Фото: jonson, Shutterstock)
| | Что такое уникальность текста и как ее проверить? Галина Аксенова
Вы наверняка уже не раз слышали, что поисковые системы особенно ценят уникальные тексты, и потому, создавая свой сайт или какой-либо интернет-проект, искренне намерены наполнять его только оригинальными произведениями мастеров пера.
Интуитивно вы уже понимаете, что уникальный текст – это текст, написанный с нуля и непохожий на другие, то есть он такой один. Без копий, без повторений. Когда вы пишете текст сами, вы уверены, что ваш текст уникален. Однако каково же бывает удивление, когда вдруг обнаруживается, что текст, который вы сами сочинили, отнюдь не уникален с точки зрения поисковых систем.
Простой пример. Вы придумали название статьи, забиваете его в поисковик и вдруг видите, что его до вас уже придумали…
На практике уникальность текстов проверяется с помощью специальных онлайн-сервисов или устанавливаемых на компьютере программ, которые работают по принципу поисковых систем. Ими пользуются и редактора сайтов, и студии интернет-сайтов, и сами авторы.
Однако оказывается, что ничего непогрешимого нет, и идеальных приложений по оценке уникальности текстов тоже. Так, взяв одну давно опубликованную на проекте статью (а следовательно, уже имеющую немало дубликатов), я решила проверить, насколько сходными окажутся результаты. Так, сервисы copyscape.ru показал 9 копий, miratools.ru обнаружил 39 дубликатов, istio.com – 23, программа DСF – более 50. Я заинтересовалась, почему же результаты столь различны.
Если объяснять простыми словами, то, с точки зрения роботов, уникальным будет тот текст, в котором порядок слов не совпадает ни с одним из имеющихся в арсенале вариантов. Именно поэтому одним из самых простых и быстрых способов сделать текст оригинальным является перестановка предложений или замена некоторых слов синонимами. И там, где человек заметит явный плагиат, робот, возможно, одобрительно пройдет мимо.
Уникальность текста проверяется поисковыми системами на основе сложных алгоритмов, смысл работы которых заключается в том, чтобы проанализировать разбитые на кусочки цепочки слов проверяемых текстов и сравнить полученные результаты. Чем короче отрезки текста, тем точнее выходит результат.
Текст разбивается на отрезки из пяти-шести слов, которые преобразуются в двоичный код. Во время проверки каждому участку текста присваивается некое уникальное число, и результат вычисляется по заданному алгоритму в виде контрольной суммы. У разных текстов контрольные числа не могут совпадать. Причем в процессе подобного «сканирования» текста конечное слово одного отрезка является первым для нового отрезка, и, следовательно, ни одно слово не теряется. Этот метод называют методом шинглов. Чем короче будут проверяемые отрезки текста, тем точнее результат. Обнаружатся не только точные копии вашего текста, но и его «легкие» переделки.
Метод пассажей предполагает разбивку текста на более крупные участки: проверка идет уже не на уровне словосочетаний, а на уровне предложений. Например, если из десяти слов одного предложения пять слов совпадут с составом другого предложения, его уникальность будет оценена в 50 процентов.
В основе большинства приложений, созданных для проверки уникальности текста, лежит метод шинглов. Однако, наряду с высокой эффективностью поиска дубликатов, у метода есть свой минус.
Надо быть очень осторожным с подобными приложениями, если вы, например, используете цитаты: тексты в кавычках могут значительно уменьшить показатель уникальности текста. То же касается и различных распространенных выражений: поговорки, пословицы, фразеологические обороты, придавая тексту оригинальность, могут существенно поубавить его уникальность.
Поэтому не стоит удивляться, если ваш собственноручно написанный оригинальный текст вдруг забракует программа: ей не до изысков стиля, все дело – в математике. 20.12.2010 Опубликовано 15.05.2011 в рубрике «Техника и Интернет»
Постоянный адрес этой статьи: http://www.shkolazhizni.ru/archive/0/n-42238/
Тэги: copyscape, istio
Методы передачи данных GET и POST 2011-02-27 17:35:50
Часто скрипты написанные на PHP требуют вмешательства пользователя, когда необходимо передать какие ...
+ развернуть текст сохранённая копия
Часто скрипты написанные на PHP требуют вмешательства пользователя, когда необходимо передать какие либо данные. Протокол HTTP позволяет нам это сделать посредством передачи GET и POST запросов серверу. И в PHP есть поддержка этих методов передачи. Метод GET При использовании метода GET, данные передаются путем добавления их к URL-адресу вызываемого сценария, предназначенного для обработки полученной информации. [...]
Похожие объявления: - Связь PHP с базой данных MySQL
Тэги: get, isset, post
AACSource - сорс клиент для IceCast2 2010-08-25 10:14:00
Более двух лет назад, работал на местном радио. Директор поставил задачу транслировать эфир ...
+ развернуть текст сохранённая копия
Более двух лет назад, работал на местном радио. Директор поставил задачу транслировать эфир радио в интернет в формате AAC.
После долгих поисков бесплатного свободного сервера транслирующего поток в формате AAC, решено было самостоятельно написать сорс-клиент для IceCast2.
За основу был взят собственный сорс-клиент IceCast в части формата взаимодействия с сервером. Поскольку на тот момент у меня небыло опыта компилирования Си-кода под линукс, а также опыта написания системных утилит, пришлось писать на Shell.
Итак, по просьбам некоторых коллег, представляю исходники моего "безобразия" по имени AACSource: Срипт запуска Конфигурационный файл Собственно сам AACSource
Тэги: icecast, linux, shell
В конференции новый jabber bot isida 2009-08-12 20:04:22
В конференции penza@conference.jabber.ru появился новый бот isida. На него возложена функция " ...
+ развернуть текст сохранённая копия
В конференции penza@conference.jabber.ru появился новый бот isida. На него возложена функция "новый бот лучше старых двух". Говорят он занимает мало места и почти не просит есть, любит работать и умеет молчать если ему прикажут. Вобщем идеальный друг для нашего сообщества. Его имя Isida bot. Как с ним подружиться?
Чтобы получить справку по команде наберите "help команды". Для более подробной информации ниже приведены ссылки перейдя по которым можно изучить весь перечень команд бота.
Команды бота isida Команды с уровнем доступа 1 могут использовать только администраторы и владельцы конференций http://code.google.com/p/isida/wiki/level1#prefix
Команды с уровнем доступа 2 могут использовать только владельцы бота http://code.google.com/p/isida/wiki/level2
Команды с уровнем доступа 0 могут использовать все посетители без ограничения http://code.google.com/p/isida/wiki/level0
Тэги: bot, isida, jabber
Fashion: Для тех, кто действительно любит дождь: «живой» плащ дождевик для людей и растений 1970-01-01 03:00:00
...
+ развернуть текст сохранённая копия
Пожалуй, движение «зелёных» и прочих три-хагеров ныне цветет и пахнет, как никогда раньше. Задумались люди наконец-то о матушке Природе или это всего лишь очередная модная тенденция, продиктованная знаменитостями - не так уж и важно. Как говориться, лишь бы не было войны. Правда, у самых ярых защитников флоры и фауны есть одна общая, но далеко не самая приятная черта: демонстрировать свои убеждение при каждом удобном и не очень случае. А поскольку гринписовцев хватает и среди дизайнеров, то всяческие растущие-цветущие девайсы появляются в их коллекциях, как грибы после дождя. Кстати, о дожде сейчас и пойдет речь. А, точнее, о свежем «зелёном» плаще дождевике, который весьма красноречиво поведает о жизненной позиции своего обладателя. Подробнее.. URL записи
Тэги: airi, isoda, дождевик, дождь, плащ, погода, природа, растение, тайвек, экология
Главная / Главные темы / Тэг «ista»
|
Взлеты Топ 5
Падения Топ 5
|