Сравнительный анализ средств автоматизацииподготовки текстов к публикации в Интернете

Для проведения сравнительного анализа рассмотренных веб-сервисов и библиотек был подготовлен специализированный набор тестов, проверяющих работу типографов с пунктуацией, пробелами и пробельными символами, неразрывными конструкциями, гиперссылками, HTMLтегами и специальными символами – всего около 800 различных правил и их вариаций. Примеры тестовых данных приведены в таблице 2.5.

Проверяемое правило

Исходные данные

Ожидаемый результат

1

Нормализация пунктуации

“Он же гений, как ты да я. А гений и злодейство − две вещи несовместные. Не правда ль?’

«Он же гений, как ты да я. А гений и злодейство — две вещи несовместные. Не правда ль?»

2

Замена двух знаков «..», «?.», «!.» на три «...», «?..», «!..» или один «.», «?», «!».

Да что тут предлагать?. А то пишут, пишут.. Конгресс, немцы какие-то.. Голова пухнет. Взять всё, да и поделить..

Да что тут предлагать?.. А то пишут, пишут... Конгресс, немцы какие-то... Голова пухнет. Взять всё, да и поделить...

3

Замена двух одинаковых знаков на один

Извольте,, я буду молчать;; но расстаться с моими убеждениями я не могу:: они для меня единственное утешение в жизни..

Извольте, я буду молчать; но расстаться с моими убеждениями я не могу: они для меня единственное утешение в жизни.

4

Замена «!?» на «?!»

Кто б Измаила смел спросить о том!?

Кто б Измаила смел спросить о том?!

5

Оставляем 3 знака («???», «?!!», «?..» и т. п.) вместо 4 или 5

Да что тут предлагать?... А то пишут, пишут..... Конгресс, немцы какие-то... Голова пухнет. Взять всё, да и поделить....

Да что тут предлагать?.. А то пишут, пишут... Конгресс, немцы какие-то... Голова пухнет. Взять всё, да и поделить...

6

Замена трёх точек на знак многоточия в тексте

Помню, отлично помню... Диван, дюжина стульев и круглый столик о шести ножках. Мебель была превосходная, гамбсовская... А почему вы вспомнили?

Помню, отлично помню… Диван, дюжина стульев и круглый столик о шести ножках. Мебель была превосходная, гамбсовская… А почему вы вспомнили?

7

Замена трёх точек на знак многоточия в лакунах

Раскольников так объяснял свое преступление: «мне надо было узнать тогда, и поскорей узнать <...> тварь ли я дрожащая или право имею».

Раскольников так объяснял свое преступление: «мне надо было узнать тогда, и поскорей узнать <…> тварь ли я дрожащая или право имею».

8

Замена одиночной кавычки в слове на апострофов

Жанна д'Арк — национальная героиня Франции

Жанна д&#700;Арк — национальная героиня Франции

9

Замена обратного апострофа после гласной на символ ударения

Лев Никола`евич Толсто`й — один из наиболее широко известных русских писателей и мыслителей, почитаемый как один из величайших писателей мира

Лев Никола?евич Толсто?й — один из наиболее широко известных русских писателей и мыслителей, почитаемый как один из величайших писателей мира

10

Замена 1-3 дефисов, окруженных пробелами, на тире

Хотел всегда жить в городе — и вот кончаю жизнь в деревне

Хотел всегда жить в городе — и вот кончаю жизнь в деревне

11

Замена 1-3 дефисов после кавычек, скобок и пунктуации на тире

Тире (фр. tiret, от tirer --- растягивать)---один из знаков препинания, применяемый во многих языках

Тире (фр. tiret, от tirer — растягивать) – один из знаков препинания, применяемый во многих языках

12

Замена 1-3 дефисов после переноса строки или в начале предложения на тире

  • -- А кто?
  • --- Это, господа, судыръ мой, не кто другой, как капитан Копейкин!
  • — А кто?
  • — Это, господа, судыръ мой, не кто другой, как капитан Копейкин!

13

Замена 1-3 дефисов после точки, троеточия, восклицательного и вопросительного знаков на тире

- Куда же пристать?-Вот одна пристань, а другая там, дальше где-то, у моста...-Так пристанем к ближайшей!---сказал кто-то.

— Куда же пристать? — Вот одна пристань, а другая там, дальше где-то, у моста… — Так пристанем к ближайшей! — сказал кто-то.

14

Кавычки (уровень 1)

"А что Казбич? " — спросил я нетерпеливо у штабс-капитана

«А что Казбич?» — спросил я нетерпеливо у штабс-капитана (Лермонтов М. Ю.)

15

Кавычки (уровень 2)

Работа В. И. Ленина "О карикатуре на марксизм и об "империалистическом экономизме""

Работа В. И. Ленина «О карикатуре на марксизм и об „империалистическом экономизме“»

16

Кавычки (уровень 3)

Следующая остановка – "станция метро "Стадион "Спартак"""

Следующая остановка – «станция метро „Стадион «Спартак»“»

17

Автоматическая расстановка пунктуации

Армия погрязла в коррупции но военная прокуратура держит руку на пульсе: нет-нет да и выведет на чистую воду очередного хапугу в погонах

Армия погрязла в коррупции, но военная прокуратура держит руку на пульсе: нет-нет да и выведет на чистую воду очередного хапугу в погонах.

18

Расстановки мягких переносов (мест возможного переноса)

Широкая электрификация южных губерний даст мощный толчок развитию сельского хозяйства

Ши­ро­кая элект­ри­фи­ка­ция юж­ных гу­бер­ний даст мощ­ный тол­чок раз­ви­тию сельс­ко­го хо­зяйст­ва

19

Удаление лишних пробелов

«Некоторые враги могут быть таким же предметом гордости, как и друзья»

«Некоторые враги могут быть таким же предметом гордости, как и друзья» (С. Лукьяненко)

20

Расстановка пропущенных пробелов

«Орловская деревня(мы говорим о восточной части Орловской губернии)обыкновенно расположена среди распаханных полей, близ оврага, кое-как превращённого в грязный пруд» (И. Тургенев)

«Орловская деревня (мы говорим о восточной части Орловской губернии) обыкновенно расположена среди распаханных полей, близ оврага, кое-как превращённого в грязный пруд» (И. Тургенев)

21

Расстановка неразрывных пробелов между сокращениями «гл.», «стр.», «рис.», «илл.», «ил.», «ст.», «с.», «п.» и номером

Подробнее об этом Вы можете прочитать в п. 92 гл. IX на стр. 25. Смотрите рис. 3.2.1 и илл. 5а на с. 92

Подробнее об этом Вы можете прочитать в п. 92 гл. IX на стр. 25. Смотрите рис. 3.2.1 и илл. 5а на с. 92

22

Расстановка неразрывных пробелов между сокращениями «г.», «ул.», «пер.», «просп.», «пл.», «бул.», «наб.», «пр.», «ш.», «туп.», «б-р», «пр-кт» и географическими названиями

г. Москва ул. Красноказарменная

Октябрьский пер.

просп. Вернадского

Красная пл.

бул. Дмитрия Донского

Краснопресненская наб.

пр. Серебрякова

ш. Энтузиастов

Сходненский туп.

Новинский б-р

Ленинский пр-кт

г. Москва ул. Красноказарменная

Октябрьский пер.

просп. Вернадского

Красная пл.

бул. Дмитрия Донского

Краснопресненская наб.

пр. Серебрякова

ш. Энтузиастов

Сходненский туп.

Новинский б-р

Ленинский пр-кт

23

Расстановка неразрывных пробелов между сокращениями «д.», «кв.», «эт.» и номерами

г. Москва, ул. Ленина, д. 8с1, кв. 14, эт. 1

г. Москва, ул. Ленина, д. 8с1, кв. 14, эт. 1

24

Расстановка неразрывных пробелов между словами «век», «год» (сокращениями «в.», «г.») и числами

Первая мировая война началась 28 июля 1914 г.

В рамках истории русской культуры XVIII века обычно принято выделять два периода.

Первая мировая война началась 28 июля 1914 г.

В рамках истории русской культуры XVIII века обычно принято выделять два периода.

25

Расстановка неразрывных пробелов в датах

Первая мировая война началась 28 июля 1914 г.

Первая мировая война началась 28 июля 1914 г.

26

Расстановка неразрывных пробелов перед частицами

Если тебе случится рассердится на кого бы то ни было, рассердись в то же время на самого себя, хотя бы за то, что сумел рассердиться на другого

Если тебе случится рассердится на кого бы то ни было, рассердись в то же время на самого себя, хотя бы за то, что сумел рассердиться на другого

27

Расстановка неразрывных пробелов в сокращениях «и т. д.», «и т. п.», «в т. ч.», «т. к.», «т. е.», «и др.», «до н. э.», «ч. т. д.», «ю. ш.», «с. ш.», «з. д.», «в. д.» (или обрамление в неразрывные конструкции)

«Будьте внимательны к своим мыслям, они — начало поступков» (Лао-Цзы, VI – V века до н. э.)

Они мало разговаривали, т. к. это было запрещено.

«Будьте внимательны к своим мыслям, они — начало поступков» (Лао-Цзы, VI – V века <nobr>до н. э.</nobr>)

Они мало разговаривали, т. к. это было запрещено.

28

Расстановка неразрывных пробелов возле тире

— Именно то, что наиболее естественно, — заметил Бол-Кунац, — менее всего подобает человеку.

Тире — один из знаков препинания, применяемый во многих языках.

— Именно то, что наиболее естественно, — заметил Бол-Кунац, — менее всего подобает человеку.

Тире — один из знаков препинания, применяемый во многих языках.

29

Расстановка неразрывных пробелов перед последним словом в предложениях

Все это было бы смешно, когда бы не было так грустно. (М. Лермонтов)

Все это было бы смешно, когда бы не было так грустно. (М. Лермонтов)

30

Расстановка неразрывных пробелов после предлогов и союзов

«Дело не в слове, а в тоне, в каком это слово произносится» (В. Белинский)

«Дело не в слове, а в тоне, в каком это слово произносится» (В. Белинский)

31

Выделение гиперссылок

Пример предложения http://example. com/page. html. Следующее предложение.

Пример предложения <a href="http://example. com/page. html">http://example. com/page. html</a>. Следующее предложение.

32

Добавление пропущенного протокола http

Cсылка example. com/page. html в середине предложения без протокола

Cсылка <a href="http://example. com/page. html">example. com/page. html</a> в середине предложения без протокола

33

Выделение гиперссылок внутри скобок, кавычек и т. п.

Ссылка (http://example. com/page. html) в скобках

Ссылка (<a href="http://example. com/page. html">http://example. com/page. html</a>) в скобках

34

Выделение русскоязычных гиперссылок

шкафы-и-окна. рф домен. ua. com

<a href="http://xn-----6kcc2bjeyh0d0b1b. xn--p1ai">шкафы-и-окна. рф</a>

<a href=”http://xn--d1acufc. ua. com”>домен. ua. com</a>

35

Конвертация хоста URL адреса в нижний регистр

HTTP://WWW. Example. Com/Page1. HTML?Param=Value

http://www. example. com/Page1. HTML?Param=Value

36

Перевод в верхний регистр управляющих конструкций в URL адресах

http://www. example. com/a%c2%b1b

http://www. example. com/a%C2%B1b

37

Перекодировка управляющих конструкций в URL адресах в явные символы

http://www. example. com/%7Euser

http://www. example. com/~user

38

Удаление порта по умолчанию в URL адресах

http://www. example. com:80

http://www. example. com

39

Удаление сегментов-точек в URL адресах

http://www. example. com/../a/b/../c/./d. html

http://www. example. com/a/c/d. html

40

Удаление дублированных слешей

http://www. example. com/foo//bar. html

http://www. example. com/foo/bar. html

41

Удаление «www» как элемента верхнего доменного уровня в URL адресах

http://www. example. com

http://example. com

42

Удаление «?» в URL адресах при пустом запросе

http://www. example. com/display?

http://www. example. com/display

43

Сохранение HTML разметки документа

<section><p>Войдя в <span>гостиную</span>, Степан Аркадьевич извинился, объяснил, что был задержан тем князем, <span id="span1"> который был всегдашним козлом-искупителем всех его опаздываний и <i>отлучек</i></span></p>...</section>

<section><p>Войдя в <span>гостиную</span>, Степан Аркадьевич извинился, объяснил, что был задержан тем князем, <span id="span1"> который был всегдашним козлом-искупителем всех его опаздываний и <i>отлучек</i></span></p>...</section>

44

Объединение в неразрывные конструкции номеров телефонов

8 (495) 123-45-67

+7 495 123-45-67 доб. 1234

<nobr>8 (495) 123-45-67</nobr>

<nobr>+7 495 123-45-67 доб. 1234</nobr>

45

Объединение в неразрывные конструкции IP адресов

  • 127.0.0.1
  • 255.128.1.90

<nobr>127.0.0.1</nobr>

<nobr>255.128.1.90</nobr>

46

Выделение адресов электронной почты

support@site. com

<a href="mailto:support@site. com">support@site. com</a>

47

Объединение в неразрывные конструкции коротких слов разделенных дефисом

Он еще жив, но живет еле-еле!

Он еще жив, но живет <nobr>еле-еле</nobr>!

48

Объединение в неразрывные конструкции номеров и параграфов

Выполните управжнение №23 из §24

Выполните управжнение <nobr>№23</nobr> из <nobr>§24</nobr>

49

Объединение в неразрывные конструкции чисел

511 068 убитых и 264 301 пропавших без вести

<nobr>511 068</nobr> убитых и <nobr>264 301</nobr> пропавших без вести

50

Привязка сокращения ГОСТ к номеру

ГОСТ 3489.1-71

«Шрифты типографские»

<nobr>ГОСТ 3489.1-71</nobr>

«Шрифты типографские»

Таблица 2.5. Примеры тестовых данных

Число пройденных тестов в процентном соотношении для разных средств подготовки текстов представлено на диаграмме 2.1.

Диаграмма 2.1. Число пройденных тестов (в процентах) для разных типографов

 
Оригинал текста доступен для загрузки на странице содержания
< Пред   СОДЕРЖАНИЕ   Скачать   След >