Народный тест Тьюринга.
Предварительный вариант технической спецификации

Предварительный вариант технической спецификации Народного теста Тьюринга выложен для обсуждения. Вы можете высказать замечания и предложения по поводу внесения каких-либо изменений в форуме "Программы-собеседники". Через некоторое время будет также подготовлен вариант правил для пользователей, более простой для восприятия и не перегруженный техническими подробностями.

Техническая спецификация на проведение Народного теста Тьюринга

0. Роли участников Народного теста Тьюринга.
============================================

        0.1. Координатор.
        -----------------

Функции:

  Официальные объявления, 
  организация обсуждений, 
  принятие окончательных решений, 
  проведение первого этапа тестирования,
  публикация результатов.

        0.2. Технический организатор.
        -----------------------------

Функции:

  Первичная обработка тестового набора,
  регистрация участников второго этапа,
  рассылка тестовых данных,
  сбор оценок,
  анализ результатов тестирования,
  создание и сопровождение программ для генерации тестовых наборов, 
  сбора и обработки статистики.

        0.3. Участники первого этапа.
        -----------------------------

Функции:

  Проведение диалогов с программами,
  приведение протоколов к заданной форме,
  передача протоколов диалогов техническому организатору.

        0.4. Участники второго этапа.
        -----------------------------

Функции:

  Выставление оценок диалогам из тестового набора,
  передача выставленных оценок техническому организатору.

        0.5. Зрители.
        -------------

Функции:

  Поедание хлеба и созерцание зрелищ :)

1. Первый этап. Построение тестового набора.
============================================

        1.1. Получить список тестируемых программ.
        ------------------------------------------

Результат:

  Координатор оглашает список тестируемых программ
  и обеспечивает доступ к дистрибутивам программ из этого списка.

        1.2. Получить список участников первого этапа.
        ----------------------------------------------

Результат:

  Координатор оглашает список участников первого этапа,
  устанавливает контакт с каждым участником,
  сообщает каждому участнику правила проведения первого этапа тестирования.

        1.3. Получить набор диалогов.
        -----------------------------

Порядок действий:

  Участники первого этапа скачивают дистрибутивы программ из списка 1.1 
  из источника, указанного координатором.

  Участники первого этапа инсталлируют программы из списка 1.1
  и проводят с каждой программой N диалогов.

  Правила проведения диалогов: 

        ...

  Участники первого этапа оформляют текстовый файл с протоколом N диалогов
  с каждой программой из списка 1.1.
  
Формат текстового файла:

  Заголовок диалога, строка вида 

        Программа "Кодовое имя программы" участник "Кодовое имя участника" диалог "Номер диалога".

  Текст диалога, последовательность строк вида

        Ч: Фраза
        П: Фраза
        Ч: Фраза
        П: Фраза
        ...

  Разделитель диалогов, строка вида

        ========================

  Между заголовком диалога и текстом диалога должна находиться пустая строка.
  
  Между текстом диалога и разделителем диалогов должна находиться 
  пустая строка.

Результат:

  Каждый участник первого этапа должен передать координатору текстовый файл 
  с протоколом N диалогов с каждой программой из списка 1.1. 

2. Второй этап. Тестирование программ.
======================================

Тестирование программ выполняется офф-лайн, передача тестируемых диалогов 
и их оценок выполняется посредством электронной почты.

        2.1. Обработка тестового набора.
        --------------------------------

Порядок действий:

  Координатор передает техническому организатору протоколы диалогов 
  участников первого этапа. 

  Технический организатор формирует единый протокол диалогов. В дальнейшем 
  этот протокол не дополняется и не модифицируется.

  Единый протокол диалогов используется в дальнейшем для построения 
  персональных наборов диалогов, предназначенных для оценивания 
  участниками второго этапа.

Результат:

  Текстовый файл, содержащий все диалоги, которые будут оцениваться 
  на втором этапе тестирования. 

  Формат текстового файла указан в пункте 1.3.

        2.2. Регистрация участников второго этапа.
        ------------------------------------------

Порядок действий:

  Лица, желающие принять участие во втором этапе тестирования (оценивании 
  диалогов из тестового набора), должны прислать на адрес технического 
  организатора заявку на участие.

  Заявкой на участие считается письмо на адрес ***@***.***.**, в теме 
  которого указано "Народный тест Тьюринга. Заявка на участие".

  Указанный адрес электронной почты ***@***.***.** является фиктивным 
  и предназначен только для приема заявок на участие в тестировании.

  Для подтверждения заявки в ответ будет выслано письмо с действительного 
  адреса технического организатора с темой "Народный тест Тьюринга. 
  Подтверждение заявки на участие" и просьбой указать желаемое количество 
  диалогов для оценивания в одной порции тестовых данных.

Результат:

  Технический организатор формирует список участников второго тура,
  представленный адресами электронной почты, на которые в дальнейшем 
  будут высланы тестовые данные, и с которых будут получены оценки диалогов.

  Список участников может дополняться в ходе проведения 
  второго этапа тестирования.

        2.3. Рассылка тестовых данных.
        ------------------------------

Порядок действий:

  Для каждого участника из списка 2.2 формируется уникальный тестовый набор 
  с помощью программы, условно названной "Генератор тестовых наборов".

  Уникальный тестовый набор для каждого участника состоит из всех диалогов, 
  предназначенных для оценивания, перечисленных в произвольном порядке. 
  
  Из тестового набора устранена информация о происхождении диалога (программа, 
  с которой проводился диалог, участник первого этапа, проводивший диалог, 
  номер диалога).

  Каждый диалог сопровождается уникальным кодом, по которому 
  может быть восстановлена информация о происхождении диалога (программа, 
  с которой проводился диалог, участник первого этапа, проводивший диалог, 
  номер диалога).

  Уникальный тестовый набор разбивается на некоторое количество порций 
  (в каждой из которых присутствует количество диалогов, указанное данным 
  участником второго этапа в заявке на участие) и высылается участникам 
  второго этапа по адресам, с которых была написана заявка на участие.

Формат текстового файла из уникального тестового набора:

  Текст диалога, последовательность строк вида

        Ч: Фраза
        П: Фраза
        Ч: Фраза
        П: Фраза
        ...

  Код диалога, строка вида

        Код диалога: {********-****-****-****-************} 

  Место для выставления оценки, строка вида

        Оценка: [ ]

  Разделитель диалогов, строка вида

        ========================

  Между текстом диалога, кодом диалога, местом для выставления оценки 
  и разделителем диалога должна находиться пустая строка.
  
        2.4. Оценка диалогов участниками второго этапа.
        -----------------------------------------------

  Участники второго этапа получают несколько писем, в каждом из которых
  присутствует некоторое количество диалогов. Для каждого диалога указано поле 
  для выставления оценки.

  Участник должен "ответить" на каждое такое письмо, процитировав исходное 
  и выставив оценку каждому диалогу в специально отведенное поле.

  Размер порции диалогов выбирается таким образом, 
  чтобы каждую порцию диалогов можно было оценить "за один раз".

        2.5. Сбор оценок.
        -----------------

  Ответы с оценками участников второго этапа приходят на адрес 
  технического организатора.

  Технический организатор собитает ответы в текстовый файл, который 
  в дальнейшем будет автоматически проанализирован программой 
  "Анализатор статистики".

        2.6. Анализ и публикация результатов тестирования.
        --------------------------------------------------

  Анализ собранной статистики выполняется автоматически, программой 
  с условным названием "Анализатор статистики".

  Для анализа статистики существенны только уникальные коды диалогов 
  и соответствующие им оценки.

  В результате анализа вычисляются суммарные оценки всех диалогов 
  каждой программы. Результат передается координатору тестирования 
  и публикуется в сети.
  
  Формула расчета сообщается координатором перед началом тестирования, 
  по результатам обсуждения с заинтересованной общественностью.

Основной результат:

  Список программ с суммарными оценками, отсортированный по оценкам.

Дополнительный результат:

  Полная таблица статистики в виде:

  +------------------------------------------+-----------+-----------+-----+
  |                                          | участник1 | участник2 | ... |
  +------------------------------------------+-----------+-----------+-----+
  | Имя программы/имя человека/номер диалога |    оценка |    оценка |     |
  +------------------------------------------+-----------+-----------+-----+
  | ...                                      |    оценка |    оценка |     |
  +------------------------------------------+-----------+-----------+-----+

В настоящий момент координатором Народного теста Тьюринга является Инга Кесс, технический организатор (и составитель данной спецификации) - Андрей Филинский; участники 1 этапа - Инга Кесс, Андрей Филинский, Mihail, Константин Шевчук (Human_in_Shadow). Список участников второго этапа пока не составлялся. Список участников первого этапа может быть изменен. Сроки проведения Народного теста Тьюринга пока не уточнены; сначала будут утверждены "технический" и "пользовательский" варианты спецификации.

Обсудить предварительный вариант технической спецификации, высказать свои предложения и замечания вы можете в форуме "Программы-собеседники"

 
На главную страницу
 
Все о программах-собеседниках
 
Народный тест Тьюринга - 2005

Hosted by uCoz