Способы визуализации текстовой информации. Визуализация информации в текстовых документах Визуальная информация в текстовых документах

ПОВТОРЕНИЕ № 1. Определите, к какой группе операций (редактирование или форматирование) относятся следующие действия: форматирование Замена одного символа на другой; Вставка пропущенного слова; Изменение шрифта; Удаление фрагмента текста; Выравнивание текста по ширине; Автоматическая проверка правописания; Изменение междустрочного расстояния; Изменение размеров полей страницы; Удаление ошибочного символа; Поиск и замена; Перемещение фрагментов текста.

ПОВТОРЕНИЕ № 2. Определите, к какой группе (свойства символов или № 2 свойства абзацев) относятся следующие свойства: абзацев Шрифт Выравнивание Интервал после Отступ первой строки Начертание Цвет Междустрочный интервал Отступ слева Отступ перед Размер (кегль) шрифта Отступ справа

ПОВТОРЕНИЕ № 3. В каких из приведённых ниже предложений № 3 правильно расставлены пробелы между словами и знаками препинания? Где допущены ошибки? 1) 2) 3) 4) С родной земли –умри, не сходи. Речь вести – не лапти плести. Где родился, там и сгодился. Говорить -смешно, утаить-грешно.

ПОВТОРЕНИЕ № 4. Выберите параметры, устанавливаемые при № 4 задании параметров страницы: Ориентация Стиль Размер шрифта Размер бумаги Номера страниц Поля Междустрочный интервал Отступы Выравнивание абзацев Начертание

Визуализация – представление информации в наглядном виде. Текстовую информацию представляют в виде списков, таблиц, диаграмм, снабжают иллюстрациями (фотографиями, схемами, рисунками). Визуализация информации Список Таблица Диаграмма Иллюстрация Список предметов 8 класс 1. Алгебра 2. Английский язык Оценка 3. Биология 4. Ученик. География Математика Информатика 5. Геометрия 6. Информатика и ИКТ Иванов 7. История 5 Саша 4 8. Литература 9. ОБЖ Орлова Катя 4 5 10. Обществознание 11. Русский язык Петров 12. Физика Витя 5 5 13. Химия 14. Черчение Диаграмма цветов

СПИСКИ Всевозможные перечни в документах оформляются с помощью списков. Пункты перечня рассматриваются как абзацы, оформленные по единому образцу. Структура списка Маркированные 1. 2. 3. 4. 5. 6. Русский язык Алгебра ОБЖ Обществознание Биология Технология Расписание уроков - пример нумерованного списка Нумерованные Русский язык Литература Алгебра Геометрия Физика Перечень предметов изучаемых в 7 классе - пример маркированного списка

По структуре различают одноуровневые и многоуровневые списки. Список, элемент которого сам является списком, называется многоуровневым Пример: Глава 1. Информация и информационные процессы § 1. 1. Информация и её свойства 1. 1. 1. Информация и сигнал 1. 1. 2. Виды информации 1. 1. 3. Свойства информации § 1. 2. Информационные процессы 1. 2. 1. Понятие информационного процесса 1. 2. 2. Сбор информации

ИНСТРУМЕНТЫ СОЗДАНИЯ СПИСКОВ Быстро создать списки с пометками и нумерацией можно с помощью кнопок на панели инструментов:

ИЗМЕНЕНИЕ МАРКИРОВАННЫХ СПИСКОВ: Для изменения вида маркера можно воспользоваться кнопкой Изменить. Появится окно Изменение маркированного списка, в котором содержатся дополнительные пометки. При нажатии кнопки Маркер появляется диалоговое окно Символ, в котором можно выбрать любой из символов в качестве маркера списка.

ИЗМЕНЕНИЕ НУМЕРОВАННЫХ СПИСКОВ: Чтобы создать свой вариант нумерованного списка, следует щелкнуть кнопку Изменить. Появится окно Изменение нумерованного списка. В поле Формат номера указывается текст перед и после номера элемента списка, например). В поле Нумерация- стиль нумерации. В поле Начать с…указывается число (или буква), с которого должен начинаться список. Для изменения шрифта номеров элементов списка используется кнопка Шрифт.

ПРЕДСТАВИМ ПЕРЕЧЕНЬ УСТРОЙСТВ КОМПЬЮТЕРА В ВИДЕ МНОГОУРОВНЕВОГО СПИСКА, ИМЕЮЩЕГО ЧЕТЫРЕ УРОВНЯ ВЛОЖЕННОСТИ. Устройства современного компьютера Процессор Память Оперативная память Долговременная память Жесткий магнитный диск Дискета Флэш-память Оптические диски CD DVD Устройства ввода Клавиатура Мышь Сканер Графический планшет Цифровая камера Микрофон Джойстик Устройства вывода Монитор Жидкокристаллический монитор Монитор на электронно-лучевой трубке Принтер Матричный принтер Струйный принтер Лазерный принтер

Придадим первой строке стиль форматирования, например, Заголовок 1. Устройства современного компьютера Процессор Память Оперативная память Долговременная память Жесткий магнитный диск Дискета Флэш-память Оптические диски CD DVD Устройства ввода Клавиатура Мышь Сканер Графический планшет

Преобразуем оставшиеся строки в многоуровневый § § список. Для этого необходимо: выделить все оставшиеся строки; отдать команду Формат-Список. В диалоговом окне Список перейти на вкладку Многоуровневый и выбрать там список типа:

Список приобретет следующий вид: Устройства современного компьютера 1. Процессор 2. Память 3. Оперативная память 4. Долговременная память 5. Жесткий магнитный диск 6. Дискета 7. Флэш-память 8. Оптические диски 9. CD 10. DVD 11. Устройства ввода 12. Клавиатура 13. Мышь 14. Сканер 15. Графический планшет 16. Цифровая камера 17. Микрофон 18. Джойстик 19. Устройства вывода 20. Монитор 21. Жидкокристаллический монитор 22. Монитор на электронно-лучевой трубке 23. Принтер 24. Матричный принтер 25. Струйный принтер 26. Лазерный принтер

Выделим пункты 3 – 10 и понизим их уровень. Для этого воспользуемся кнопкой Увеличить отступ Устройства современного компьютера 1. Процессор 2. Память 3. Оперативная память 4. Долговременная память 5. Жесткий магнитный диск 6. Дискета 7. Флэш-память 8. Оптические диски 9. CD 10. DVD 11. Устройства ввода 12. Клавиатура 13. Мышь 14. Сканер 15. Графический планшет 16. Цифровая камера 17. Микрофон 18. Джойстик

Список приобретет следующий вид: Устройства современного компьютера 1. Процессор 2. Память 2. 1. Оперативная память 2. 2. Долговременная память 2. 3. Жесткий магнитный диск 2. 4. Дискета 2. 5. Флэш-память 2. 6. Оптические диски 2. 7. CD 2. 8. DVD 3. Устройства ввода 4. Клавиатура 5. Мышь 6. Сканер 7. Графический планшет 8. Цифровая камера 9. Микрофон 10. Джойстик

Выделим пункты 2. 3 – 2. 8 и понизим их уровень. Для этого воспользоваться кнопкой Увеличить отступ Устройства современного компьютера 1. Процессор 2. Память 2. 1. Оперативная память 2. 2. Долговременная память 2. 3. Жесткий магнитный диск 2. 4. Дискета 2. 5. Флэш-память 2. 6. Оптические диски 2. 7. CD 2. 8. DVD 3. Устройства ввода 4. Клавиатура 5. Мышь 6. Сканер 7. Графический планшет 8. Цифровая камера 9. Микрофон 10. Джойстик

Список приобретет следующий вид: Устройства современного компьютера 1. Процессор 2. Память 2. 1. Оперативная память 2. 2. Долговременная память 2. 2. 1. Жесткий магнитный диск 2. 2. 2. Дискета 2. 2. 3. Флэш-память 2. 2. 4. Оптические диски 2. 2. 5. CD 2. 2. 6. DVD 3. Устройства ввода 4. Клавиатура 5. Мышь 6. Сканер 7. Графический планшет 8. Цифровая камера 9. Микрофон 10. Джойстик

Выделить пункты 2. 2. 5 – 2. 2. 6 и понизим их уровень. Устройства современного компьютера 1. Процессор 2. Память 2. 1. Оперативная память 2. 2. Долговременная память 2. 2. 1. Жесткий магнитный диск 2. 2. 2. Дискета 2. 2. 3. Флэш-память 2. 2. 4. Оптические диски 2. 2. 4. 1. CD 2. 2. 4. 2. DVD 3. Устройства ввода 4. Клавиатура 5. Мышь 6. Сканер 7. Графический планшет 8. Цифровая камера 9. Микрофон 10. Джойстик

Повторим аналогичные операции для других пунктов списка: 3. Устройства ввода 3. 1. Клавиатура 3. 2. Мышь 3. 3. Сканер 3. 4. Графический планшет 3. 5. Цифровая камера 3. 6. Микрофон 3. 7. Джойстик 4. Устройства вывода 4. 1. Монитор 4. 1. 1. Жидкокристаллический монитор 4. 1. 2. Монитор на электронно-лучевой трубке 4. 2. Принтер 4. 2. 1. Матричный принтер 4. 2. 2. Струйный принтер 4. 2. 3. Лазерный принтер

Визуализация информации в текстовых документах

1. Списки

Теория:

Списки позволяют человеку воспринимать информацию лучше.

Списки являются удобным вариантом форматирования абзацев по единому образцу и применяются для размещения в документе различных перечней.

Обрати внимание!

По способу оформления списки различают:

  • нумерованные;
  • маркированные.

Элементы (пункты) нумерованного списка обозначаются с помощью последовательных чисел, для записи которых могут использоваться арабские и римские цифры.

Элементы списка могут быть пронумерованы и буквами — русскими или латинскими.

Нумерованный список принято использовать в тех случаях, когда имеет значение порядок следования пунктов. Особенно часто такие списки используют для описания последовательности действий.


В дневнике обучающегося расписание уроков на каждый учебный день — это нумерованные списки.

При создании новых, удалении или перемещении существующих элементов нумерованного списка в текстовом процессоре вся нумерация списка меняется автоматически.

Элементы маркированного списка обозначаются с помощью значков-маркеров. Пользователь может выбрать в качестве маркера любой символ компьютерного и даже небольшое графическое изображение.

Маркированный список используют в тех случаях, когда порядок следования элементов в нём не важен. Например, в виде маркированного списка можно оформить перечень предметов, изучаемых вами в школе.

По структуре различают одноуровневые и многоуровневые списки.

Список, элемент которого сам является списком, называется многоуровневым.

Списки создаются в текстовом процессоре с помощью команды строки меню или кнопок панели форматирования.

2. Таблицы

Теория:

Для удобства восприятия информации часто в текстовых документах используют таблицы. Представленная в таблице информация наглядна, компактна и легкообозрима.

Таблицу используют для описания ряда объектов, обладающих одинаковыми наборами свойств. Наиболее часто используются таблицы, состоящие из столбцов (граф) и строк. Например, расписание уроков, расписание движения автобусов, самолётов, поездов и многое другое.

Обрати внимание!

Правила оформления таблиц:
1. Заголовок таблицы должен давать представление о содержащейся в ней информации.
2. Заголовки столбцов и строк должны быть краткими, не содержать лишних слов и, по возможности, сокращений.
3. В таблице должны быть указаны . Если они общие для всей таблицы, то указываются в заголовке таблицы (либо в скобках, либо через запятую после названия). Если единицы измерения различаются, то они указываются в заголовке соответствующей строки или столбца.
4. Желательно, чтобы все ячейки таблицы были заполнены. При необходимости в них заносят следующие условные обозначения:
? — данные неизвестны; х — данные невозможны;
i — данные должны быть взяты из вышележащей ячейки.

В ячейках таблиц могут быть размещены тексты, числа, изображения.

Создать таблицу можно с помощью соответствующего пункта меню или кнопки на панели инструментов, указав необходимое число столбцов и строк; в некоторых текстовых процессорах таблицу можно «нарисовать».

Созданную таблицу можно редактировать, изменяя ширину столбцов и высоту строк, добавляя и удаляя столбцы и строки, объединяя и разбивая ячейки.

Вводить информацию в ячейки можно:

  • с помощью клавиатуры;
  • копировать и вставлять заранее подготовленные фрагменты.

В текстовых процессорах есть возможность автоматически преобразовать имеющийся текст в таблицу и наоборот. Внешний вид таблицы можно оформить самостоятельно, подобрав тип, ширину и цвет границ ячеек, цвет фона ячеек, отформатировав содержимое ячеек. Кроме того, отформатировать таблицу можно автоматически.

Для изменения вида границ ячеек и заливки внутренней области, а также выполнения некоторых других действий используется панель Таблицы и границы.

Можно установить различный вид, толщину и цвет границ, а также сделать невидимыми некоторые границы ячеек или далее всей таблицы.

Обрати внимание!

Применять заливку внутренней области следует осторожно. Во-первых, не надо использовать цвет, кроме оттенков серого, если не предполагается цветной печати. Во-вторых, текст на фоне заливки должен хорошо читаться.

В узких столбцах текст трудно размещать по горизонтали, поэтому в программе предусмотрена возможность изменения направления текста в ячейке.

Во многих таблицах в первой строке располагаются заголовки столбцов. Чтобы в больших таблицах заголовки повторялись на каждом листе, надо включить для первой строки функцию повторить заголовки.

При работе в таблице на горизонтальной линейке отображается ширина текущей ячейки и маркеры отступов текста. Поэтому работа с текстом в ячейке выполняется так же, как и на обычной странице, только ширина строки существенно меньше. Для символов и абзацев можно установить все возможные значения параметров. Чтобы привязать рисунки к ячейке, они должны иметь положение «в тексте».

3. Графические изображения в текстовом документе

Теория:

Современные текстовые процессоры позволяют включать в документы различные графические изображения, созданные пользователем в других программах или найденные им в сети Интернет. Готовые графические изображения можно редактировать, изменяя их размеры, основные цвета, яркость и контрастность, поворачивая, накладывая друг на друга и т.д.

Во многих текстовых процессорах имеется возможность непосредственного создания графических изображений из наборов автофигур (графических примитивов). Также есть возможность создания красочных надписей с использованием встроенных текстовых эффектов. В состав некоторых текстовых процессоров входит коллекция картинок — стилизованных графических изображений. Большинство картинок являются объектами векторной графики.

Визуализировать числовую информацию, содержащуюся в таблице, можно с помощью диаграмм, средства создания которых также включены в текстовые процессоры.

Наиболее мощные текстовые процессоры позволяют строить разные виды графических схем, обеспечивающих текстовой информации.

Существует два способа расположения графического изображения в текстовом документе: «в тексте» и «вне текста». Если изображение имеет положение «в тексте», то оно занимает место между двумя символами. При этом может увеличиться высота строки. Поэтому в строках обычно располагаются небольшие рисунки, если рисунок большой, то его помещают в отдельной строке.

При расположении изображения «вне текста», оно может занимать любое место на листе. Изображение можно группировать с другими графическими объектами, делать надписи на рисунке.

Для изображений «вне текста» задают разные виды обтекания текстом:

  • вокруг рамки;
  • по контуру;
  • сквозное;
  • за текстом;
  • перед текстом;
  • сверху и снизу.

При оформлении страницы с иллюстрациями следует придерживаться следующих правил:

1. Для более компактного размещения рисунков использовать положение «вокруг рамки».

2. Не следует размещать рисунок посередине текста. Это затрудняет восприятие, так как строки начинаются с одной стороны рисунка, а заканчиваются с другой. Лучше сдвинуть рисунок к правой или левой границе листа.

3. Необходимо следить, чтобы внешние границы рисунка совпадали с внутренними границами полей листа.

4. Если рисунок занимает более 3/4 ширины текста, то лучше выбрать расположение текста сверху и снизу. В этом случае можно установить для рисунка положение «в тексте» и поместить его на отдельной строке (в пустом абзаце).

5. Рисунки должны быть соразмерны количеству изображенных на них элементов. Чем больше на рисунке информационных элементов, тем он должен быть крупнее.

При создании рисунка из автофигур, находящихся на панели Рисования, автоматически появляется объект «полотно» — прямоугольная рамка на всю ширину страницы. Все автофигуры, входящие в состав рисунка, должны располагаться внутри одного полотна.

Полотно — это графический объект, который имеет границы и внутреннюю область.

К полотну, как к любому графическому объекту, можно применять форматирование. Размеры полотна можно изменить по размеру рисунка, так, чтобы не оставалось много пустого пространства. Полотно с рисунком может занимать положение «в тексте» и «вне текста».

Полотно отображает переход пользователя от режима работы с текстом к режиму работы с графикой. Чтобы завершить работу над рисунком, надо щёлкнуть вне полотна, чтобы продолжить — щёлкнуть внутри полотна. Если полотно не активизировано, то для рисования новой автофигуры появится новое полотно. После завершения работы полотно вместе с расположенными на нём объектами составляет единое изображение. Имеется возможность отключить полотно.

Обрати внимание!

Однако полотно помогает «не потерять» отдельные элементы рисунка. Когда вы создаете рисунок, надо следить, чтобы все объекты находились в пределах одного полотна, то есть, чтобы оно было активизировано, пока вы не закончили создание изображения.

По окончании создания изображения, объекты изображения обычно группируют. Их можно разгруппировать и при необходимости внести изменения в изображение.

ВИЗУАЛИЗАЦИЯ ИНФОРМАЦИИ В ТЕКСТОВЫХ ДОКУМЕНТАХ

Визуализация – представление информации в наглядном виде. Текстовую информацию представляют в виде списков, таблиц, диаграмм, снабжают иллюстрациями (фотографиями, схемами, рисунками).

Списки

Всевозможные перечни в документах оформляются с помощью списков . Пункты перечня рассматриваются как абзацы, оформленные по единому образцу. По способу оформления списки могут быть нумерованные и маркированные.

Элементы нумерованного списка обозначаются с помощью чисел или букв (латинских или русских).

Элементы маркированного списка обозначаются с помощью значков-маркеров .

По структуре списки различают: одноуровневые и многоуровневые. Все примеры, рассмотренные, ранее являются одноуровневыми списками

Список, элемент которого сам является списком, называется многоуровневым .

Таблицы

Для описания ряда объектов, обладающих одинаковыми наборами свойств, наиболее часто используются таблицы , состоящие из столбцов (граф) и строк.

Представленная в таблице информация наглядна, компактна и легкообазрима.

Правильно оформленная таблица имеет следующую структуру:

В ячейках таблиц могут быть размещены тексты, числа, изображения.

Пример таблицы:

Создать таблицу можно с помощью соответствующего пункта меню или кнопки на панели инструментов, указав необходимое число столбцов и строк; в некоторых текстовых процессорах таблицу можно нарисовать. Созданную таблицу можно редактировать, изменяя ширину столбцов и высоту строк, объединяя и разбивая ячейки. Вводить информацию в ячейки таблицы можно так: с помощью клавиатуры, копировать и вставлять заранее подготовленные фрагменты. В текстовых процессорах есть возможность автоматически преобразовывать имеющийся текст в таблицу.

Внешний вид таблицы можно оформить самостоятельно, подобрав тип, ширину и цвет границ ячеек, цвет фона ячеек, отформатировав содержимое ячеек. Кроме того отформатировать таблицу можно автоматически.

Графические изображения

Современные текстовые процессоры позволяют включать в документы различные графические изображения.

Текстовые процессоры позволяют строить разные виды графических схем обеспечивающих визуализацию текстовой информации.

Виды графических схем в текстовом процессоре Microsoft Word.

Известно, что текстовая информация воспринимается человеком лучше, если она визуализирована – организована в виде списков, таблиц, диаграмм, снабжена иллюстрациями (фотографиями, рисунками, схемами). Современные текстовые процессоры предоставляют пользователям широкие возможности визуализации информации в создаваемых документах. Рассмотрим с вами сначала списки . Запишите себе подзаголовок – «Списки» .

Всевозможные перечни в документах оформляются с помощью списков. При этом все пункты перечня рассматриваются как абзацы, оформленные по единому образцу. По способу оформления различают нумерованные и маркированные списки.

Элементы нумерованного списка обозначаются с помощью последовательных чисел, для записи которых могут использоваться арабские и римские цифры. Элементы списка могут быть пронумерованы и буквами – русскими или латинскими. Нумерованный список принято использовать в тех случаях, когда имеет значение порядок следования пунктов. Особенно часто такие списки используют для описания последовательности действий. Нумерованные списки вы регулярно создаете, заполняя в дневнике расписание уроков на каждый день.

При создании новых, удалении или перемещении существующих элементов нумерованного списка в текстовом процессоре вся нумерация списка меняется автоматически.

Элементы маркированного списка обозначаются с помощью знаков-маркеров. Пользователь может выбрать в качестве маркера любой символ компьютерного алфавита, и даже небольшое графическое изображение. С помощью маркированного списка оформлены ключевые слова в начале каждого параграфа вашего учебника.

Маркированный список используют в тех случаях, когда порядок следования элементов в нем не важен. Например, в виде маркированного списка можно оформить перечень предметов, изучаемых вами в 7 классе.

По структуре различают одноуровневые и многоуровневые списки. Списки в рассмотренных выше примерах имеют одноуровневую структуру. Список, элемент которого сам является списком, называется многоуровневым. Так оглавление вашего учебника информатики является многоуровневым списком. Списки создаются в текстовом процессоре с помощью команды строки меню или кнопок панели форматирования.

Записываем следующий подзаголовок – «Таблицы» .

Для описания ряда объектов, обладающими одинаковыми наборами свойств, наиболее часто используются таблицы, состоящие из столбцов (граф) и строк. Вам хорошо известно табличное представление расписания уроков, в табличной форме представляются расписание движения автобусов, самолетов, поездов и так далее.

Представленная в таблице информация наглядна, компактна и легко обозрима. Таблица может содержать не только символы и текст, но и какие-то графические изображения.

Создать таблицу можно с помощью соответствующего пункта меню или кнопки на панели инструментов, указав необходимое число столбцов и строк; в некоторых текстовых процессорах таблицу можно «нарисовать». Созданную таблицу можно редактировать, изменяя ширину столбцов и высоту строк, добавляя и удаляя столбцы и строки, объединяя и разбивая ячейки. Вводить информацию в таблицу можно так: с помощью клавиатуры, копировать и вставлять заранее подготовленные фрагменты.

Внешний вид таблицы можно оформить самостоятельно, подобрав тип, ширину и цвет границ ячеек, цвет фона ячеек, отформатировав содержимое ячеек.

Как я уже говорила, таблица может содержать не только текст, но и графическое изображение. Готовые графические изображения можно редактировать, изменяя их размеры, основные цвета, яркость и контрастность, поворачивая и так далее.

Во многих текстовых процессорах имеется возможность непосредственного создания графических изображений из наборов автофигур. Так же есть возможность создания красочных надписей с использованием встроенных текстовых эффектов. Визуализировать числовую информацию, содержащуюся в таблице, можно с помощью диаграмм, средства, создания которых также включены в текстовые процессоры.

Эта вся теория, которая необходима вам для визуализации информации. - Ваши вопросы, что вам непонятно? - Может что-то еще нужно повторить? (Учитель отвечает на вопросы детей).

Теперь я предлагаю вам выполнить практическую работу, на сегодняшнем уроке мы смоделируем ситуацию деловой игры.

Предположим, что некоторое издательство, выпускающее газету открывает новый отдел, которые будет готовить статьи.

Для работы отделов набран штат (по 2 человек), состоящий из редакторов, дизайнеров, художников – оформителей, журналистов. Сегодня каждый отдел должен пройти аттестацию, чтобы доказать свое право на дальнейшую работу. Для этого к концу урока нужно выполнить некоторые задания.

Аттестация отдела будет проводиться на конкурсной основе: каждый участник выполняет свое задание и передает готовую работу редактору на проверку. Результат работы всего отдела зависит от качества работы каждого сотрудника.

Существует два понимания понятия “визуализация текстов” . В первом понимании, визуализация текстов – это генерация изображений по входному тексту. В приводится такой пример: по тексту, представленному на Рис. 1 требуется построить изображение. При этом, система, генерирующая изображение, должна понимать, что компьютер может стоять только на столе и автоматически добавлять стол на изображение. Среди русскоязычных работ этого направления отметим работу .

Другое понимание понятие “визуализация текстов” предполагает изображение либо элементов текста, либо структур, извлеченных из текста, для образовательных или аналитических нужд. В этом понимании можно выделить несколько различных подходов.

Исторически первый – так называемое облако тегов (tag cloud) . Облако тегов представляет собой множество ключевых слов или словосочетаний – тегов, извлеченных из текста, изображенных на плоскости. Размер каждого тега зависит от частоты или любой другой частотной характеристики тега. Облако тегов может иметь любую форму: действительно облака или, например, звездочки.



Рис. 2, источник: https://uniqons.wordpress.com

Иногда цветом на облаке тегов отмечают какие-нибудь важные характеристики, например, авторство. На Рис. 3 голубым отображены слова из предвыборной программы Обамы, коричневым – Маккейна. Облака тегов позволяют получить общее представление о содержании текста или коллекции текстов. Например, в облака тегов используются для визуализации частых слов в позитивных или негативных твитах, посвященных предвыборной кампании 2012 г. в США. Одно из развитий идеи облака тегов представлено в : облака Вена , которые используются для демонстрации контраста между двумя коллекциями текстов.



Рис. 3, источник: http://www.planetizen.com/


Рис. 4, Три примера облаков Вена. В левой части частые слова из твитов, содержащих слово “Orioles” (бейсбольная команда), в правой – “Nationals”. По середине расположены общие для обеих коллекций слова.

Второй подход к визуализации текстов – это визуализация элементов текстов и теоретико-множественных, алгебраических или статистических отношений между ними. Как правило, в рамках этого подхода текст или коллекция текстов представляется графом, в котором вершины – ключевые слова или словосочетания или понятия, выделенные из текстов, соединенные ребрами по каким-то принципам. Например, в составляется панорама тем – графом из трех соединенных компонент (см. Рис. 5), каждая доля соответствует одному источнику, узлы подписаны ключевыми словами или словосочетаниям. В графе есть два типа ребер: внутри одной компоненты, соответствующей одному источнику, узлы соединены в соответствии с взаимной встречаемостью. Второй тип ребер соединяет похожие узлы из разных источников. В строится карта метро (Рис. 6) – визуализация динамических кластеров ключевых слов и словосочетаний.



Рис. 5


Рис. 6

Третий подход к визуализации текстов – это визуализация моделей скрытых тем (latent topics) . Система Serendip выделяет скрытые темы в тексте и подсвечивает слова во входном тексте цветом (Рис. 7). У каждой скрытой темы свой цвет, интенсивность цвета зависит от степени вхождения слова в тему. В скрытые темы представлены в виде облаков тегов (Рис. 8).


Рис. 7

Рис. 8

Наша работа по построению графа референций принадлежит ко второму подходу. В графе референций узлы – это ключевые слова или словосочетания, а направленные ребра вида A->B задают отношение вида “если встречается A, то встречается B”, то есть, “B встречается в контексте A”.

  1. Chang, Angel X., Manolis Savva, and Christopher D. Manning. "Semantic parsing for text to 3d scene generation." ACL 2014 (2014): 17.
  2. Усталов, Дмитрий, и Александр Кудрявцев. "Применение онтологии при синтезе изображения по тексту." Доклады всероссийской научно–практической конференции Анализ Изображений, Сетей и Текстов. М.: Национальный Открытый Университет ИНТУИТ. 2012
  3. Coupland D. (1996), Microserfs, Flamingo
  4. Wang, H., Can, D., Kazemzadeh, A., Bar, F., & Narayanan, S. (2012, July). A system for real-time twitter sentiment analysis of 2012 us presidential election cycle. In Proceedings of the ACL 2012 System Demonstrations (pp. 115-120). Association for Computational Linguistics.
  5. Coppersmith, G., & Kelly, E. (2014). Dynamic Wordclouds and Vennclouds for Exploratory Data Analysis. Sponsor: Idibon, 22.
  6. Liu, S., Wang, X., Chen, J., Zhu, J., & Guo, B. (2014, October). TopicPanorama: A full picture of relevant topics. In Visual Analytics Science and Technology (VAST), 2014 IEEE Conference on (pp. 183-192). IEEE.
  7. Shahaf, D., Yang, J., Suen, C., Jacobs, J., Wang, H., & Leskovec, J. (2013, August). Information cartography: creating zoomable, large-scale maps of information. In Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 1097-1105). ACM.
  8. Alexander, E., Kohlmann, J., Valenza, R., Witmore, M., & Gleicher, M. (2014, October). Serendip: Topic model-driven visual exploration of text corpora. In Visual Analytics Science and Technology (VAST), 2014 IEEE Conference on (pp. 173-182). IEEE.
  9. Smith, A., Chuang, J., Hu, Y., Boyd-Graber, J., & Findlater, L. (2014). Concurrent Visualization of Relationships between Words and Topics in Topic Models. Sponsor: Idibon, 79.