Особое значение имеет правильная разработка методик эксперимента. Типичные ошибки и трудности применения эксперимента Основные распространенные ошибки проведения эксперимента

Общие принципы планирования экспериментов

Сравнение.

Рандомизация.

Репликация.

Однородность.

Стратификация.

уровнями фактора


Название: Общие принципы планирования экспериментов
Детальное описание:

С момента своего появления наука ищет пути к познанию законов окружающего мира. Совершая одно открытие за другим, ученые поднимаются все выше и выше по лестнице знания, стирая границу неизвестности и выходя на новые рубежи науки. Этот путь лежит через эксперимент. Сознательно ограничивая бесконечное разнообразие природы искусственными рамками научного опыта, мы превращаем его в понятную для человеческого разума картину мира.

Эксперимент как научное исследование - это форма, в которой и посредством которой наука существует и развивается. Эксперимент требует тщательной подготовки перед его проведением. В биомедицинских исследованиях планирование экспериментальной части исследования имеет особенно большое значение по причине широкой вариабельности свойств, характерной для биологических объектов. Эта особенность является основной причиной трудностей при интерпретации результатов, которые могут значительно различаться от опыта к опыту.

Статистические проблемы обосновывают необходимость выбора такой схемы эксперимента, которая минимизировала бы влияние вариабельности на выводы ученого. Поэтому цель планирования эксперимента заключается в создании схемы, которая необходима для получения как можно большей информации при наименьших затратах для выполнения исследования. Более точно планирование эксперимента можно определить как процедуру выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Планирование эксперимента появилось в агробиологии и связано с именем английского статистика и биолога сэра Рональда Эйлмера Фишера. В начале XX века на агробиологической станции в Ротамстеде (Великобритания) начались исследования влияния удобрений на урожайность различных сортов зерновых. Ученые вынуждены были считаться как с большой изменчивостью объектов исследования, так и с большой продолжительностью опытов (около года). В этих условиях не было иного пути, кроме разработки продуманного плана эксперимента для уменьшения негативного влияния указанных факторов на точность выводов. Применив статистические знания к биологическим проблемам, Фишер пришел к разработке собственных принципов теории статистического вывода и положил начало новой науке о планировании и анализе экспериментов.

Сам Рональд Фишер объяснял основы планирования на примере эксперимента произведенного для выяснения способности некой английской леди различать, что было налито в чашку в первую очередь - чай или молоко. Следует отметить, что для настоящих английских леди важно, чтобы чай наливался в молоко, а не наоборот, нарушение последовательности будет признаком невежества и испортит вкус напитка.

Эксперимент проходит просто: леди пробует чай с молоком и по вкусу пытается понять, в какой очередности были налиты оба ингредиента. План, разработанный для этого исследования, характеризуется рядом свойств.

Сравнение. Во многих исследованиях точное определение результата измерения затруднительно или невозможно. Так, например, леди не сможет количественно оценить качество чая, она будет сравнивать его с эталоном правильно приготовленного напитка, вкус которого знаком ей с детства. Как правило, в научном эксперименте объект сравнивается либо с неким заранее заданным стандартом, либо с контрольным объектом.

Рандомизация. Это очень важный момент в планировании. В нашем примере рандомизация относится к тому, в каком порядке представлять чашки на дегустацию. Рандомизация необходима для того, чтобы стало возможным применение статистических методов для анализа результатов исследования.

Репликация. Повторяемость - это необходимый компонент постановки эксперимента. Недопустимо делать выводы о способности к определению качества чая только по одной чашке. Результат каждого отдельного измерения (дегустации) несет в себе долю неопределенности, возникшей под влиянием множества случайных факторов. Следовательно, для выявления источника вариабельности необходимо провести несколько испытаний. С этим свойством связана чувствительность эксперимента. Фишер отмечал, что пока число чашек чая не превысит некоторого минимума, невозможно сделать какие-либо однозначные выводы.

Однородность. Несмотря на необходимость повторения измерений (репликация), их число не должно быть слишком велико, чтобы не утратилась однородность. Разность температур чашек, притупление вкуса и т. п. при превышении некоторого предельного числа повторений, могут затруднить анализ результатов эксперимента.

Стратификация. Выходя за рамки примера Р. Фишера к более абстрактному описанию экспериментального плана можно дополнительно указать такое свойство как стратификация (блокировка). Стратификация - это распределение экспериментальных единиц в относительно однородные группы (блоки, слои). Процедура стратификации позволяет минимизировать эффект известных нам неслучайных источников вариабельности. Внутри каждого блока ошибку эксперимента предполагают меньшей относительно варианта со случайным отбором для эксперимента такого же количества объектов. Например, при исследовании нового лекарственного препарата мы имеем два уровня фактора - «препарат» и «плацебо», которые назначаются мужчинам и женщинам. В данном случае пол - это блокирующий фактор, по которому происходит разделение исследуемых на подгруппы.

Описанные выше характеристики экспериментального плана полностью или частично относятся к любому научному эксперименту. Однако для начала работы недостаточно одного только знания об общих свойствах исследования, необходима более тщательная подготовка. Создание подробного руководства в рамках одной статьи невозможно, поэтому здесь будет изложена наиболее общая информация об этапах планирования эксперимента.

Любое исследование начинается с постановки цели. Выбор проблемы для изучения и ее формулировка повлияют как на дизайн исследования, так и на выводы, которые будут сделаны по его результатам. В самом простом случае формулировка проблемы должна предполагать вопросы «Кто?», «Что?», «Когда?», «Почему?» и «Как?».

В качестве иллюстрации важности данного этапа планирования можно привести исследование, в котором проводится сбор информации о дорожно-транспортных происшествиях. В зависимости от постановки цели, работа может быть направлена на разработку нового автомобиля либо нового дорожного покрытия. Несмотря на то, что используется один и тот же набор данных, постановка задачи и выводы существенно различаются в зависимости от формулировки проблемы.

После выбора цели работы следует определить так называемые зависимые переменные. Это переменные, которые будут измеряться при проведении исследования. Например, показатели функционирования тех или иных систем организма человека или лабораторных животных (частота сердечных сокращений, артериальное давление, содержание ферментов в крови и т. п.), а также любые другие характеристики объектов исследования, изменение которых будет для нас информативно.

Поскольку есть зависимые переменные, то должны быть еще и независимые переменные. Другое их название - факторы. Факторами исследователь оперирует в эксперименте. Это может быть доза исследуемого препарата, уровень стресса, степень физической нагрузки и т. д. Взаимосвязь между фактором и зависимой переменной удобно представлять с помощью кибернетической системы, часто называемой «черный ящик».

Черный ящик - это система, механизм работы которой нам неизвестен. Однако исследователь имеет информацию о том, что происходит на входе и выходе черного ящика. При этом состояние выхода функционально зависит от состояния входа. Соответственно y1, y2, ..., yp - это зависимые переменные, величина которых зависит от факторов (независимых переменных x1, x2, ..., xk). Параметры w1, w2, ..., wn представляют собой возмущающие воздействия, не поддающиеся контролю или изменяющиеся со временем.

В общем виде это можно записать так: y=f(x1, x2, ..., xk).

Каждый фактор в опыте может принимать одно из нескольких значений. Такие значения называют уровнями фактора . Может оказаться, что фактор способен принимать бесконечное число значений (например, доза лекарственного препарата), однако на практике выбирается несколько дискретных уровней, количество которых зависит от задач конкретного опыта.

Фиксированный набор уровней факторов определяет одно из возможных состояний черного ящика. Вместе с тем, это есть условия проведения одного из возможных опытов. Если перебрать все возможные наборы таких состояний, то мы получим полное множество различных состояний данной системы, количество которых будет числом всех возможных экспериментов. Для того, чтобы вычислить количество возможных состояний, достаточно число уровней факторов q (если для всех факторов оно одинаково) возвести в степень количества факторов k.

Совокупность всех возможных состояний определяет сложность черного ящика. Так, система из десяти факторов на четырех уровнях может находиться более чем в миллионе разных состояний. Очевидно, что в подобных случаях невозможно провести исследование, включающее все возможные опыты. Поэтому на этапе планирования решается вопрос о том, сколько опытов и каких именно необходимо провести для решения поставленной задачи.

Следует отметить, что свойства объекта исследования имеют существенное значение для эксперимента. Во-первых, нам надо иметь информацию о степени воспроизводимости результатов опытов с данным объектом. Для этого можно провести эксперимент, а затем повторить его через неравные промежутки времени и сравнить результаты. Если разброс значений не превышает наших требований к точности эксперимента, то объект удовлетворяет требованию воспроизводимости результатов. Другое требование к объекту - его управляемость. Управляемым считается объект, на котором можно провести активный эксперимент. В свою очередь, активный эксперимент - это такой эксперимент, в процессе которого исследователь имеет возможность выбора уровней факторов, представляющих для него интерес.

На практике не существует полностью управляемых объектов. Как уже говорилось выше, на реальный объект действуют как управляемые, так и неуправляемые факторы, что приводит к вариабельности результатов между отдельными объектами. Отделить случайные изменения от закономерных, вызванных различными уровнями независимых переменных, мы можем лишь с помощью статистических методов.

Но статистические методы эффективны лишь в определенных условиях. Одно их таких условий - это требование некоего минимального размера выборок, используемых в проведении эксперимента. Очевидно, что чем шире диапазон изменения признаков от объекта к объекту, тем больше должна быть повторность опыта, т. е. численность экспериментальных групп.

Поскольку, неоправданно большое число испытаний сделает исследование слишком дорогим, а недостаточный объем выборки может поставить под сомнение точность выводов, определение необходимого объема выборок играет решающую роль в планировании эксперимента. Методы вычисления минимального объема выборок подробно описаны в специальной литературе, поэтому привести их в статье не представляется возможным. Тем не менее, следует упомянуть, что они требуют предварительного определения средней величины исследуемого показателя и ее ошибки. Источником такой информации могут послужить публикации о похожих исследованиях. Если они еще не проводились, то возникает необходимость в выполнении предварительного «пилотного» исследования для оценки вариабельности признака.

Следующий этап в планировании экспериментов - это рандомизация. Рандомизация представляет собой процесс используемый для группировки объектов таким образом, чтобы у каждого из них была равная вероятность попасть в контрольную или опытную группу. Другими словами, выбор участников исследования должен происходить случайно, чтобы исследование не было отклонено в сторону «предпочтительного» для исследователя результата.

Рандомизация помогает предотвратить смещения, обусловленные причинами, которые не были непосредственно учтены в плане эксперимента. Для этого, например, формирование экспериментальных групп лабораторных животных производится случайным образом. Однако полная рандомизация возможна далеко не всегда. Так, в клинических исследованиях принимают участие пациенты определенной возрастной группы, с заранее заданным диагнозом и тяжестью заболевания, а, следовательно, отбор участников не является случайным. Кроме того, ограничивают рандомизацию так называемые «блочные» планы экспериментов. Эти планы подразумевают, что отбор в каждый блок выполняется в соответствии с определенными неслучайными условиями, а случайный отбор объектов исследования возможен только внутри блоков. Процесс рандомизации легко осуществить с помощью специализированного статистического программного обеспечения или специальных таблиц.

В заключение необходимо сказать о необходимости учета в плане исследования помимо требований медицины и статистики еще и морально-этических норм. Не стоит забывать о том, что не только люди, но и лабораторные животные должны вовлекаться в эксперимент в соответствии с этическими принципами.



В.В. Никандров указывает, что достижение главной цели эксперимента – предельно возможной однозначности в понимании связей между явлениями внутренней психической жизни и их внешними проявлениями – достигается благодаря следующим основным характеристикам эксперимента:

1) инициатива экспериментатора в проявлении интересующих его психологических фактов;

2) возможность варьирования условий возникновения и развития психических явлений;

3) строгий контроль и фиксация условий и процесса их протекания;

4) изоляция одних и акцентирование других факторов, обусловливающих изучаемые феномены, которая дает возможность выявления закономерностей их существования;

5) возможность повторения условий эксперимента для многократной проверки получаемых научных данных и их накопления;

6) варьирование условий для количественных оценок выявляемых закономерностей.

Таким образом, психологический эксперимент можно определить как метод, при котором исследователь сам вызывает интересующие его явления и изменяет условия их протекания с целью установить причины возникновения этих явлений и закономерности их развития. Кроме того, получаемые научные факты могут неоднократно воспроизводиться благодаря управляемости и строгому контролю условий, что дает возможность их проверки, а также накопления количественных данных, на основе которых можно судить о типичности или случайности изучаемых явлений.

4.2. Виды психологического эксперимента

Эксперименты бывают нескольких видов. В зависимости от способа организации выделяют лабораторный, естественный и полевой эксперименты. Лабораторный эксперимент проводится в специальных условиях. Исследователь планово и целенаправленно воздействует на объект изучения, чтобы изменить его состояние. Достоинством лабораторного эксперимента можно считать строгий контроль за всеми условиями, а также применение специальной аппаратуры для измерения. Недостатком лабораторного эксперимента является трудность переноса полученных данных на реальные условия. Испытуемый в лабораторном эксперименте всегда осведомлен о своем участии в нем, что может стать причиной мотивационных искажений.

Естественный эксперимент проводится в реальных условиях. Его достоинство состоит в том, что изучение объекта осуществляется в контексте повседневной жизни, поэтому полученные данные легко переносятся в реальность. Испытуемые не всегда проинформированы о своем участии в эксперименте, поэтому не дают мотивационных искажений. Недостатки – невозможность контроля всех условий, непредвиденные помехи и искажения.

Полевой эксперимент проводится по схеме естественного. При этом возможно использование портативной аппаратуры, позволяющей более точно регистрировать получаемые данные. Испытуемые проинформированы об участии в эксперименте, однако привычная обстановка снижает уровень мотивационных искажений.

В зависимости от цели исследования различают поисковый, пилотажный и подтверждающий эксперименты. Поисковый эксперимент направлен на поиск причинно-следственной связи между явлениями. Он проводится на начальном этапе исследования, позволяет сформулировать гипотезу, выделить независимую, зависимую и побочные переменные (см. 4.4) и определить способы их контроля.

Пилотажный эксперимент – это пробный эксперимент, первый в серии. Он проводится на небольшой выборке, без строгого контроля переменных. Пилотажный эксперимент позволяет устранить грубые ошибки в формулировке гипотезы, конкретизировать цель, уточнить методику проведения эксперимента.

Подтверждающий эксперимент направлен на установление вида функциональной связи и уточнение количественных отношений между переменными. Проводится на заключительном этапе исследования.

В зависимости от характера влияния на испытуемого выделяют констатирующий, формирующий и контрольный эксперименты. Констатирующий эксперимент включает в себя измерение состояния объекта (испытуемого или группы испытуемых) до активного воздействия на него, диагностику исходного состояния, установление причинно-следственных связей между явлениями. Целью формирующего эксперимента является применение способов активного развития или формирования каких-либо свойств у испытуемых. Контрольный эксперимент – это повторное измерение состояния объекта (испытуемого или группы испытуемых) и сравнение с состоянием до начала формирующего эксперимента, а также с состоянием, в котором находится контрольная группа, не получавшая экспериментального воздействия.

По возможности влияния экспериментатора на независимую переменную выделяют спровоцированный эксперимент и эксперимент, на который ссылаются. Спровоцированный эксперимент – это опыт, в котором экспериментатор сам изменяет независимую переменную, при этом наблюдаемые экспериментатором результаты (виды реакций испытуемого) считаются спровоцированными. П. Фресс называет данный тип эксперимента «классическим». Эксперимент, на который ссылаются, – это опыт, в котором изменения независимой переменной осуществляются без вмешательства экспериментатора. К этому виду психологического эксперимента прибегают тогда, когда независимые переменные оказывают воздействие на испытуемого, значительно растянутое во времени (например, система воспитания и т. п.). Если воздействие на испытуемого может вызвать серьезное негативное физиологическое или психологическое нарушение, то такой эксперимент проводить нельзя. Однако бывают случаи, когда негативное воздействие (например, травма головного мозга) происходит в реальности. Впоследствии такие случаи могут быть обобщены и изучены.

4.3. Структура психологического эксперимента

Главными компонентами любого эксперимента являются:

1) испытуемый (исследуемый субъект или группа);

2) экспериментатор (исследователь);

3) стимуляция (выбранный экспериментатором способ воздействия на испытуемого);

4) ответ испытуемого на стимуляцию (его психическая реакция);

5) условия опыта (дополнительные к стимуляции воздействия, которые могут влиять на реакции испытуемого).

Ответ испытуемого является внешней реакцией, по которой можно судить о протекающих в его внутреннем, субъективном пространстве процессах. Сами эти процессы есть результат воздействия на него стимуляции и условий опыта.

Если ответ (реакцию) испытуемого обозначить символом R, а воздействия на него экспериментальной ситуации (как совокупности воздействий стимуляции и условий опыта) – символом S, то их соотношение можно выразить формулой R = =f (S). То есть реакция есть функция от ситуации. Но эта формула не учитывает активную роль психики, личности человека (P). В действительности реакция человека на ситуацию всегда опосредована психикой, личностью. Таким образом, соотношение между основными элементами эксперимента может быть зафиксировано следующей формулой: R = f (Р, S).

П. Фресс и Ж. Пиаже в зависимости от задач исследования выделяют три классических типа отношений между этими тремя компонентами эксперимента: 1) функциональные отношения; 2) структурные отношения; 3) дифференциальные отношения.

Функциональные отношения характеризуются вариативностью ответов (R) испытуемого (Р) при систематических качественных или количественных изменениях ситуации (S). Графически эти отношения можно представить следующей схемой (рис. 2).

Примеры функциональных отношений, выявленных в экспериментах: изменение ощущений (R) в зависимости от интенсивности воздействия на органы чувств (S); объем запоминания (R) от числа повторений (S); интенсивность эмоционального отклика (R) на действие различных эмоциогенных факторов (S); развитие адаптационных процессов (R) во времени (S) и т. п.

Структурные отношения раскрываются через систему ответов (R1, R2, Rn) на различные ситуации (Sv S2, Sn). Отношения между отдельными ответами структурируются в систему, отражающую структуру личности (Р). Схематически это выглядит так (рис. 3).


Примеры структурных отношений: система эмоциональных реакций (Rp R2, Rn) на действие стрессоров (Sv S2, Sn); эффективность решения (R1, R2, Rn) различных интеллектуальных задач (S1, S2, Sn) и т. п.

Дифференциальные отношения выявляются через анализ реакций (R1, R2, Rn) разных испытуемых (P1, P2, Pn) на одну и ту же ситуацию (S). Схема этих отношений такова (рис. 4).

Примеры дифференциальных отношений: разница скорости реакции у разных людей, национальные различия в экспрессивном проявлении эмоций и т. п.

4.4. Экспериментальные переменные и способы их контроля

Для уточнения соотношения всех факторов, входящих в эксперимент, введено понятие «переменная». Выделяют три вида переменных: независимые, зависимые и дополнительные.

Независимые переменные. Фактор, изменяемый самим экспериментатором, называется независимой переменной (НП).

В качестве НП в эксперименте могут выступать условия, в которых осуществляется деятельность испытуемого, характеристика заданий, выполнение которых требуется от испытуемого, характеристики самого испытуемого (возрастные, половые, иные различия испытуемых, эмоциональные состояния и другие свойства испытуемого или взаимодействующих с ним людей). Поэтому принято выделять следующие типы НП: ситуационные, инструктивные и персональные.

Ситуационные НП чаще всего не входят в структуру экспериментального задания, выполняемого испытуемым. Тем не менее они оказывают непосредственное воздействие на его деятельность и могут варьироваться экспериментатором. К ситуационным НП относятся различные физические параметры, например освещенность, температура, уровень шума, а также размер помещения, обстановка, размещение аппаратуры и т. п. К социально-психологическим параметрам ситуационных НП может быть отнесено выполнение экспериментального задания в изоляции, в присутствии экспериментатора, внешнего наблюдателя или группы людей. В.Н. Дружинин указывает на особенности общения и взаимодействия испытуемого и экспериментатора как на особую разновидность ситуационных НП. Этому аспекту уделяется большое внимание. В экспериментальной психологии существует отдельное направление, которое называется «психология психологического эксперимента».

Инструктивные НП связаны непосредственно с экспериментальным заданием, его качественными и количественными характеристиками, а также способами его выполнения. Инструктивной НП экспериментатор может манипулировать более или менее свободно. Он может варьировать материал задания (например, числовой, словесный или образный), тип ответа испытуемого (например, вербальный или невербальный), шкалу оценивания и т. п. Большие возможности заключаются в способе инструктирования испытуемых, информирования их о цели экспериментального задания. Экспериментатор может изменять средства, которые предлагаются испытуемому для выполнения задания, ставить перед ним препятствия, использовать систему поощрений и наказаний в ходе выполнения задания и т. д.

Персональные НП представляют собой управляемые особенности испытуемого. Обычно в качестве таких особенностей выступают состояния участника эксперимента, которые исследователь может менять, например различные эмоциональные состояния или состояния работоспособности-утомления.

Каждый испытуемый, участвующий в эксперименте, обладает множеством уникальных физических, биологических, психологических, социально-психологических и социальных признаков, которыми экспериментатор управлять не может. В некоторых случаях следует считать эти неуправляемые признаки дополнительными переменными и применять к ним способы контроля, о которых будет рассказано ниже. Однако в дифференциально-психологических исследованиях при применении факторных планов неуправляемые персональные переменные могут выступать в качестве одной из независимых переменных (подробно о факторных планах см. 4.7).

Исследователи различают также разные виды независимых переменных. В зависимости от шкалы представления можно выделить качественные и количественные НП. Качественным НП соответствуют различные градации шкал наименований. Например, эмоциональные состояния испытуемого могут быть представлены состояниями радости, гнева, страха, удивления и т. п. Способы выполнения заданий могут включать наличие или отсутствие подсказок испытуемому. Количественные НП соответствуют ранговым, пропорциональным или интервальным шкалам. Например, время, отведенное на выполнение задания, количество заданий, размер вознаграждения по результатам решения задач могут быть использованы как количественные НП.

В зависимости от количества уровней проявления независимых переменных различают двухуровневые и многоуровневые НП. Двухуровневые НП имеют два уровня проявления, многоуровневые – три или более уровней. В зависимости от количества уровней проявления НП строятся различные по сложности экспериментальные планы.

Зависимые переменные. Фактор, изменение которого является следствием изменения независимой переменной, называется зависимой переменной (ЗП). Зависимая переменная – это компонент в составе ответа испытуемого, который непосредственно интересует исследователя. В качестве ЗП могут выступать физиологические, эмоциональные, поведенческие реакции и другие психологические характеристики, которые можно зарегистрировать в ходе психологических экспериментов.

В зависимости от способа, с помощью которого можно зарегистрировать изменения, выделяют ЗП:

S наблюдаемые непосредственно;

S требующие физической аппаратуры для измерения;

S требующие психологического измерения.

К ЗП, наблюдаемым непосредственно, относятся вербальные и невербальные поведенческие проявления, которые четко и однозначно могут быть оценены внешним наблюдателем, например отказ от деятельности, плач, определенное высказывание испытуемого и т. п. К ЗП, требующим физической аппаратуры для регистрации, относятся физиологические (пульс, величина артериального давления и т. д.) и психофизиологические реакции (время реакции, латентное время, длительность, скорость выполнения действий и т. п.). К ЗП, требующим психологического измерения, относятся такие характеристики, как уровень притязаний, уровень развития или сформированности тех или иных качеств, форм поведения и т. п. Для психологического измерения показателей могут быть использованы стандартизированные процедуры – тесты, опросники и т. п. Некоторые поведенческие параметры могут быть измерены, т. е. однозначно распознаны и интерпретированы только специально обученными наблюдателями или экспертами.

В зависимости от количества параметров, входящих в зависимую переменную, различают одномерные, многомерные и фундаментальные ЗП. Одномерная ЗП представлена единственным параметром, изменения которого и изучаются в эксперименте. Примером одномерной ЗП может служить скорость сенсомоторной реакции. Многомерная ЗП представлена совокупностью параметров. Например, внимательность может оцениваться объемом просмотренного материала, количеством отвлечений, числом правильных и ошибочных ответов и т. д. Каждый параметр может фиксироваться независимо. Фундаментальная ЗП представляет собой переменную комплексного характера, параметры которой имеют некоторые известные отношения между собой. В этом случае одни параметры выступают как аргументы, а собственно зависимая переменная – как функция. Например, фундаментальное измерение уровня агрессии может рассматриваться как функция ее отдельных проявлений (мимических, вербальных, физических и др.).

Зависимая переменная должна обладать такой базовой характеристикой, как сензитивность. Сензитивность ЗП – это ее чувствительность к изменению уровня независимой переменной. Если при изменении независимой переменной зависимая переменная не изменяется, то последняя несензитивна и проводить эксперимент в таком случае не имеет смысла. Известны два варианта проявления несензитивности ЗП: «эффект потолка» и «эффект пола». «Эффект потолка» наблюдается, например, в том случае, когда предъявляемая задача настолько проста, что ее выполняют все испытуемые независимо от возраста. «Эффект пола», напротив, возникает в том случае, когда задание настолько сложно, что с ним не может справиться ни один из испытуемых.

Существуют два основных способа фиксации изменений ЗП в психологическом эксперименте: непосредственный и отсроченный. Непосредственный способ применяется, например, в экспериментах по кратковременному запоминанию. Экспериментатор непосредственно после повторения ряда стимулов фиксирует их количество, воспроизведенное испытуемым. Отсроченный способ используется в том случае, когда между воздействием и эффектом проходит определенный промежуток времени (например, при определении влияния количества заученных иностранных слов на успешность перевода текста).

Дополнительные переменные (ДП) – это сопутствующая стимуляция испытуемого, оказывающая влияние на его ответ. Совокупность ДП состоит, как правило, из двух групп: внешних условий опыта и внутренних факторов. Соответственно их принято называть внешними и внутренними ДП. К внешним ДП относят физическую обстановку опыта (освещенность, температурный режим, звуковой фон, пространственные характеристики помещения), параметры аппаратуры и оборудования (дизайн измерительных приборов, рабочий шум и т. п.), временные параметры эксперимента (время начала, продолжительность и др.), личность экспериментатора. К внутренним ДП относят настроение и мотивацию испытуемых, их отношение к экспериментатору и опытам, их психологические установки, склонности, знания, умения, навыки и опыт в данном виде деятельности, уровень утомления, самочувствие и т. п.

В идеале исследователь стремится все дополнительные переменные свести на нет или хотя бы к минимуму, чтобы выделить «в чистом виде» связь между независимой и зависимой переменными. Существует несколько основных способов контроля влияния внешних ДП: 1) элиминация внешних воздействий; 2) константность условий; 3) балансировка; 4) контрбалансировка.

Элиминация внешних воздействий представляет собой наиболее радикальный способ контроля. Он состоит в полном исключении из внешней среды каких бы то ни было внешних ДП. В лаборатории создаются условия, изолирующие испытуемого от звуков, света, вибрационных воздействий и т. п. Наиболее ярким примером может служить эксперимент по сенсорной депривации, проводимый на добровольцах в специальной камере, полностью исключающей поступление каких-либо раздражителей из внешней среды. Следует отметить, что элиминировать воздействия ДП практически невозможно, да и не всегда нужно, так как результаты, полученные в условиях элиминации внешних воздействий, вряд ли могут быть перенесены в реальность.

Следующий способ контроля – создание константных условий. Суть этого способа состоит в том, чтобы сделать воздействия ДП постоянными и одинаковыми для всех испытуемых на протяжении всего опыта. В частности, исследователь стремится сделать постоянными пространственно-временные условия эксперимента, технику его проведения, оборудование, предъявление инструкции и т. д. При тщательном применении этого способа контроля удается избежать больших погрешностей, однако проблема переноса результатов эксперимента в условия, сильно отличающиеся от экспериментальных, остается проблематичной.

В тех случаях, когда нет возможности создать и поддерживать постоянные условия на протяжении всего эксперимента, прибегают к способу балансировки. Этот способ применяется, например, в ситуации, когда внешняя ДП не поддается идентификации. В этом случае балансировка будет состоять в использовании контрольной группы. Исследование контрольной и экспериментальной групп проводится в одних и тех же условиях с той лишь разницей, что в контрольной группе отсутствует воздействие независимой переменной. Тем самым изменение зависимой переменной в контрольной группе обусловлено лишь внешними ДП, а в экспериментальной – совместным действием внешних дополнительных и независимой переменной.

Если внешняя ДП известна, то балансировка заключается в воздействии каждого ее значения в сочетании с каждым уровнем независимой переменной. В частности, такая внешняя ДП, как пол экспериментатора, в сочетании с независимой переменной (пол испытуемого) приведет к созданию четырех экспериментальных серий:

1) мужчина-экспериментатор – мужчины испытуемые;

2) мужчина-экспериментатор – женщины испытуемые;

3) женщина-экспериментатор – мужчины испытуемые;

4) женщина-экспериментатор – женщины испытуемые.

В более сложных экспериментах может применяться балансировка нескольких переменных одновременно.

Контрбалансировка как способ контроля внешних ДП практикуется чаще всего тогда, когда эксперимент включает в себя несколько серий. Испытуемый оказывается в разных условиях последовательно, однако предыдущие условия могут изменять эффект воздействия последующих. Для ликвидации возникающего в этом случае «эффекта последовательности» разным группам испытуемых экспериментальные условия предъявляются в различном порядке. Например, в первой серии эксперимента первой группе предъявляется решение интеллектуальных задач от более простых к более сложным, а второй – от более сложных к более простым. Во второй серии, напротив, первой группе предъявляется решение интеллектуальных задач от более сложных к более простым, а второй – от более простых к более сложным. Контрбалансировка применяется в тех случаях, когда есть возможность проведения нескольких серий эксперимента, однако следует учитывать, что большое число попыток вызывает утомление испытуемых.

Внутренние ДП, как указывалось выше, – это факторы, кроющиеся в личности испытуемого. Они оказывают весьма значительное влияние на результаты эксперимента, их воздействие достаточно трудно проконтролировать и учесть. Среди внутренних ДП можно выделить постоянные и непостоянные. Постоянные внутренние ДП в течение эксперимента существенно не изменяются. Если эксперимент проводится с одним испытуемым, то постоянными внутренними ДП будут его пол, возраст, национальность. К этой группе факторов также можно отнести темперамент, характер, способности, склонности испытуемого, его интересы, взгляды, убеждения и другие компоненты общей направленности личности. В случае проведения эксперимента с группой испытуемых эти факторы приобретают характер непостоянных внутренних ДП, и тогда для нивелировки их влияния прибегают к специальным способам формирования экспериментальных групп (см. 4.6).

К непостоянным внутренним ДП относятся психологические и физиологические характеристики испытуемого, которые могут либо значительно изменяться по ходу эксперимента, либо актуализироваться (или исчезать) в зависимости от целей, задач, вида, формы организации эксперимента. Первую группу таких факторов составляют физиологические и психические состояния, утомляемость, привыкание, приобретение опыта и навыков в процессе выполнения экспериментального задания. В другую группу входят установка на данный опыт и данное исследование, уровень мотивации к данной экспериментальной деятельности, отношение испытуемого к экспериментатору и своей роли подопытного и т. п.

Для уравнивания эффекта воздействия этих переменных на ответы в разных пробах существует ряд способов, успешно применяемых в экспериментальной практике.

Для устранения так называемого серийного эффекта, в основе которого лежит привыкание, используется особая очередность предъявления стимулов. Эта процедура получила название «уравновешенного чередного порядка», когда стимулы разных категорий предъявляются симметрично относительно центра стимульного ряда. Схема такой процедуры выглядит так: А В В А, где А и В – стимулы разных категорий.

Чтобы предупредить влияние на ответ испытуемого тревожности или неопытности, проводятся ознакомительные или предварительные эксперименты. Их итоги не учитываются при обработке данных.

Для предупреждения изменчивости ответов из-за накопления опыта и навыков в процессе эксперимента испытуемому предлагается так называемая «исчерпывающая практика». В результате такой практики у испытуемого до начала собственно эксперимента вырабатываются устойчивые навыки, и в дальнейших экспериментах показатели испытуемого от фактора накопления опыта и навыков уже напрямую не зависят.

В тех случаях, когда необходимо свести к минимуму влияние на ответ испытуемого утомления, прибегают к «методу вращения». Суть его состоит в том, что каждой подгруппе испытуемых предъявляется определенная комбинация стимулов. Совокупность таких комбинаций полностью исчерпывает все множество возможных вариантов. Например, при трех типах стимулов (А, Б, В) каждому из них представляется первое, второе и третье место в предъявлении испытуемым. Таким образом, первой подгруппе стимулы предъявляются в порядке АБВ, второй – АВБ, третьей – БАВ, четвертой – БВА, пятой – ВАБ, шестой – ВБА.

Приведенные способы процедурного уравнивания внутренних непостоянных ДП применимы как для индивидуальных, так и для групповых экспериментов.

Установка и мотивация испытуемых как внутренние непостоянные ДП должны поддерживаться на одном и том же уровне во время всего опыта. Установка как готовность воспринимать раздражитель и отвечать на него определенным образом создается через инструкцию, которую экспериментатор дает испытуемому. Чтобы установка была именно такой, какая требуется по задаче исследования, инструкция должна быть доступна испытуемым и адекватна задачам эксперимента. Однозначность и легкость понимания инструкции достигаются ее ясностью и простотой. Во избежание вариативности предъявления инструкцию рекомендуется зачитывать дословно или давать в письменном виде. Поддержание исходной установки контролируется экспериментатором путем постоянного наблюдения за испытуемым и корректируется путем напоминания при необходимости соответствующих указаний инструкции.

Мотивация испытуемого рассматривается главным образом как интерес к данному эксперименту. Если интерес отсутствует или слаб, то трудно рассчитывать на полноценность выполнения испытуемым предусмотренных в эксперименте заданий и на надежность его ответов. Слишком высокий интерес, «перемотивация», также чревата неадекватностью ответов испытуемого. Поэтому для получения исходно приемлемого уровня мотивации экспериментатор должен самым серьезным образом подойти к формированию контингента испытуемых и подбору стимулирующих их мотивацию факторов. В качестве таких факторов могут выступать состязательность, различные виды вознаграждения, интерес к своим показателям, профессиональный интерес и др.

Психофизиологические состояния испытуемых рекомендуется не только поддерживать на одном уровне, но и оптимизировать этот уровень, т. е. испытуемые должны находиться в «нормальном» состоянии. Следует убедиться, что до проведения опыта у испытуемого не было сверхзначимых для него переживаний, у него достаточно времени для участия в эксперименте, он не голоден и т. п. Во время проведения эксперимента не следует излишне возбуждать или подавлять испытуемого. Если же эти условия выполнить не удается, то проведение эксперимента лучше отложить.

Из рассмотренных характеристик переменных и способов их контроля становится понятой необходимость тщательной подготовки эксперимента при его планировании. В реальных условиях экспериментирования добиться 100 %-го контроля всех переменных невозможно, однако различные психологические эксперименты значительно отличаются друг от друга степенью контроля переменных. Рассмотрению вопроса оценки качества эксперимента посвящен следующий раздел.

4.5. Валидность и надежность эксперимента

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент.

Идеальный эксперимент – это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность. Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность – главный признак хорошо проведенного эксперимента.

Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента: фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной. Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.). Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих. Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта. Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок. Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом. Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.

Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия – это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности. От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

Реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

Эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

Фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

Фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии – клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента, так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.

4.6. Экспериментальные выборки

Как указывалось выше, эксперимент может проводиться либо с одним испытуемым, либо с группой испытуемых. Эксперимент с одним испытуемым проводится лишь в некоторых специфических ситуациях. Во-первых, это ситуации, когда индивидуальными различиями испытуемых можно пренебречь, т. е. испытуемым может быть любой человек (если в эксперименте изучаются его особенности в отличие, например, от животного). В других ситуациях, напротив, испытуемый представляет собой уникальный объект (гениальный шахматист, музыкант, художник и др.). Возможны также ситуации, когда от испытуемого требуется особая компетентность как результат обучения или неординарного жизненного опыта (единственный выживший в авиационной катастрофе и т. п.). Одним испытуемым ограничиваются и в тех случаях, когда повторение данного эксперимента с участием других испытуемых невозможно. Для экспериментов с одним испытуемым разработаны особые экспериментальные планы (подробно о них см. 4.7).

Чаще эксперименты проводятся с группой испытуемых. В этих случаях выборка испытуемых должна представлять собой модель генеральной совокупности, на которую затем будут распространяться результаты исследования. Первоначально исследователь решает проблему численности экспериментальной выборки. В зависимости от цели исследования и возможности экспериментатора она может составлять от нескольких испытуемых до нескольких тысяч человек. Количество испытуемых в отдельной группе (экспериментальной или контрольной) варьируется от 1 до 100 человек. Для применения статистических методов обработки рекомендуется число испытуемых в сравниваемых группах не менее 30–35 человек. Кроме того, целесообразно увеличивать количество испытуемых по крайней мере на 5-10 % от требуемого, так как часть из них или их результатов будет «отбракована» в ходе эксперимента.

Для формирования выборки испытуемых необходимо учитывать несколько критериев.

1. Содержательный. Он заключается в том, что подбор группы испытуемых должен соответствовать предмету и гипотезе исследования. (Например, бессмысленно набирать в группу испытуемых детей двухлетнего возраста для выявления уровня произвольного запоминания.) Желательно создать идеальные представления об объекте экспериментального исследования и при формировании группы испытуемых минимально отклоняться от характеристик идеальной экспериментальной группы.

2. Критерий эквивалентности испытуемых. При формировании группы испытуемых следует учесть все значимые характеристики объекта исследования, различия в выраженности которых могут существенно повлиять на зависимую переменную.

3. Критерий репрезентативности. Группа лиц, участвующих в эксперименте, должна представлять всю часть генеральной совокупности, на которую будут распространяться результаты эксперимента. Величина экспериментальной выборки определяется видом статистических мер и выбранной точностью (достоверностью) принятия или отвержения экспериментальной гипотезы.

Рассмотрим стратегии отбора испытуемых из популяции.

Случайная стратегия заключается в том, что каждому члену генеральной совокупности предоставляется равный шанс попадания в экспериментальную выборку. Для этого каждому индивиду присваивается номер, а затем с помощью таблицы случайных чисел формируется экспериментальная выборка. Данная процедура трудноосуществима, поскольку каждый представитель интересующей исследователя популяции должен быть учтен. Кроме того, случайная стратегия дает хорошие результаты при формировании экспериментальной выборки большого объема.

Стратометрический отбор используется в том случае, если в экспериментальной выборке обязательно должны быть представлены испытуемые с определенным набором характеристик (пол, возраст, уровень образования и т. п.). Выборка составляется таким образом, чтобы в ней были равно представлены испытуемые каждой страты (слоя) с заданными характеристиками.

Стратометрический случайный отбор совмещает две предыдущие стратегии. Представителям каждой страты присваиваются номера и из них случайным образом формируется экспериментальная выборка. Данная стратегия эффективна при отборе экспериментальной выборки небольшого объема.

Репрезентативное моделирование применяется в том случае, когда исследователю удается создать модель идеального объекта экспериментального исследования. Характеристики реальной экспериментальной выборки должны минимально отклоняться от характеристик идеальной экспериментальной выборки. Если исследователю известны не все характеристики идеальной модели экспериментального исследования, то применяется стратегия приближенного моделирования. Чем точнее набор критериев, описывающих популяцию, на которую предполагается распространить выводы эксперимента, тем выше его внешняя валидность.

Иногда в качестве экспериментальной выборки используются реальные группы, при этом в эксперименте либо участвуют добровольцы, либо все испытуемые привлекаются принудительно. И в том и в другом случае нарушается внешняя и внутренняя валидность.

После формирования экспериментальной выборки экспериментатор составляет план исследования. Достаточно часто эксперимент проводится с несколькими группами, экспериментальными и контрольными, которые помещаются в разные условия. Экспериментальные и контрольные группы должны быть эквивалентными на момент начала экспериментального воздействия.

Процедура подбора эквивалентных групп и испытуемых называется рандомизацией. По мнению ряда авторов, эквивалентность групп может быть достигнута при попарном отборе. В этом случае экспериментальная и контрольная группы составляются из индивидов, эквивалентных по значимым для эксперимента побочным параметрам. Идеальный вариант для попарного отбора – привлечение близнецовых пар. Рандомизация с выделением страт заключается в подборе однородных подгрупп, в которых испытуемые уравнены по всем характеристикам, кроме интересующих исследователя дополнительных переменных. Иногда для выделения значимой дополнительной переменной все испытуемые тестируются и ранжируются по уровню ее выраженности. Экспериментальная и контрольная группы формируются так, чтобы испытуемые, обладающие одинаковыми или близкими значениями переменной, попали в разные группы. Распределение испытуемых на экспериментальную и контрольную группы может проводиться и случайным методом. Как уже указывалось выше, при большой численности экспериментальной выборки этот способ дает вполне удовлетворительные результаты.

4.7. Экспериментальные планы

Экспериментальный план – это тактика экспериментального исследования, воплощенная в конкретной системе операций планирования эксперимента. Основными критериями классификации планов являются:

Состав участников (индивид или группа);

Количество независимых переменных и их уровней;

Виды шкал представления независимых переменных;

Метод сбора экспериментальных данных;

Место и условия проведения эксперимента;

Особенности организации экспериментального воздействия и способа контроля.

Планы для групп испытуемых и для одного испытуемого. Все экспериментальные планы можно разделить по составу участников на планы для групп испытуемых и планы для одного испытуемого.

Эксперименты с группой испытуемых имеют следующие преимущества: возможность обобщения результатов эксперимента на популяцию; возможность использования схем межгрупповых сравнений; экономия времени; применение методов статистического анализа. К недостаткам данного типа экспериментальных планов можно отнести: влияние индивидуальных различий между людьми на результаты эксперимента; проблему репрезентативности экспериментальной выборки; проблему эквивалентности групп испытуемых.

Эксперименты с одним испытуемым – это частный случай «планов с маленьким N». Дж. Гудвин указывает на следующие причины использования таких планов: потребности в индивидуальной валидности, так как в экспериментах с большим N возникает проблема, когда обобщенные данные не характеризуют ни одного испытуемого. Эксперимент с одним испытуемым проводится также в уникальных случаях, когда в силу ряда причин невозможно привлечь много участников. В этих случаях целью эксперимента является анализ уникальных явлений и индивидуальных характеристик.

Эксперимент с маленьким N, по мнению Д. Мартина, имеет следующие преимущества: отсутствие сложных статистических подсчетов, легкость в интерпретации результатов, возможность изучения уникальных случаев, привлечение одного-двух участников, широкие возможности манипуляции независимыми переменными. Ему свойственны и некоторые недостатки, в частности сложность процедур контроля, затруднение при обобщении результатов; относительная неэкономичность по времени.

Рассмотрим планы для одного испытуемого.

Планирование временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого во времени. Простейшая стратегия: схема А – В. Испытуемый первоначально выполняет деятельность в условиях А, а затем в условиях В. Для контроля «эффекта плацебо» применяется схема: А – В – А. («Эффект плацебо» – это реакции испытуемых на «пустые» воздействия, соответствующие реакциям на реальные воздействия.) В данном случае испытуемый не должен заранее знать, какое из условий является «пустым», а какое реальным. Однако эти схемы не учитывают взаимодействия воздействий, поэтому при планировании временных серий, как правило, применяют схемы регулярного чередования (А – В – А – В), позиционного уравнивания (А – В – В – А) или случайного чередования. Применение более «длинных» временных серий увеличивает возможность обнаружения эффекта, но приводит к ряду негативных последствий – утомлению испытуемого, снижению контроля за другими дополнительными переменными и т. п.

План альтернативных воздействий является развитием плана временных серий. Его специфика заключается в том, что воздействия А и В рандомизированно распределяются во времени и предъявляются испытуемому раздельно. Затем сравниваются эффекты от каждого из воздействий.

Реверсивный план применяется для изучения двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Затем предъявляется комплексное воздействие, состоящее из специфического компонента для первой формы поведения и дополнительного для второй. Через определенное время сочетание воздействий видоизменяют. Эффект двух комплексных воздействий оценивается.

План возрастания критериев часто используется в психологии обучения. Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост воздействия. При этом следующее воздействие предъявляется лишь после выхода испытуемого на заданный уровень критерия.

При проведении экспериментов с одним испытуемым следует учитывать, что основные артефакты практически неустранимы. Кроме того, в этом случае, как ни в каком другом, проявляется влияние установок экспериментатора и отношений, которые складываются между ним и испытуемым.

Р. Готтсданкер предлагает различать качественные и количественные экспериментальные планы . В качественных планах независимая переменная представлена в номинативной шкале, т. е. в эксперименте используются два или более качественно разных условия.

В количественных экспериментальных планах уровни независимой переменной представлены в интервальных, ранговых или пропорциональных шкалах, т. е. в эксперименте используются уровни выраженности того или иного условия.

Возможна ситуация, когда в факторном эксперименте одна переменная будет представлена в количественном, а другая – в качественном виде. В таком случае план будет комбинированным.

Внутригрупповые и межгрупповые экспериментальные планы. Т.В. Корнилова определяет два типа экспериментальных планов по критерию количества групп и условий проведения эксперимента: внутригрупповые и межгрупповые. К внутригрупповым относятся планы, в которых влияние вариантов независимой переменной и измерение экспериментального эффекта происходят в одной группе. В межгрупповых планах влияние вариантов независимой переменной осуществляется в разных экспериментальных группах.

Преимуществами внутригруппового плана являются: меньшее количество участников, устранение факторов индивидуальных отличий, уменьшение общего времени проведения эксперимента, возможность доказательства статистической значимости экспериментального эффекта. К недостаткам относятся неконстантность условий и проявление «эффекта последовательности».

Преимуществами межгруппового плана являются: отсутствие «эффекта последовательности», возможность получения большего количества данных, сокращение времени участия в эксперименте для каждого испытуемого, уменьшение эффекта выбывания участников эксперимента. Главным недостатком межгруппового плана является неэквивалентность групп.

Планы с одной независимой переменной и факторные планы. По критерию количества экспериментальных воздействий Д. Мартин предлагает различать планы с одной независимой переменной, факторные планы и планы с серией экспериментов. В планах с одной независимой переменной экспериментатор манипулирует одной независимой переменной, которая может иметь неограниченное количество вариантов проявления. В факторных планах (подробно о них см. с. 120) экспериментатор манипулирует двумя и более независимыми переменными, исследует все возможные варианты взаимодействия их разных уровней.

Планы с серией экспериментов проводятся для постепенного исключения конкурирующих гипотез. В конце серии экспериментатор приходит к верификации одной гипотезы.

Доэкспериментальные, квазиэкспериментальные планы и планы истинных экспериментов. Д. Кэмпбелл предложил разделить все экспериментальные планы для групп испытуемых на следующие группы: доэкспериментальные, квазиэкспериментальные и планы истинных экспериментов. В основе этого деления лежит близость реального эксперимента к идеальному. Чем меньше артефактов провоцирует тот или иной план и чем строже контроль дополнительных переменных, тем ближе эксперимент к идеальному. Доэкспериментальные планы менее всего учитывают требования, предъявляемые к идеальному эксперименту. В.Н. Дружинин указывает, что они могут служить лишь иллюстрацией, в практике научных исследований их следует по возможности избегать. Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований, они специально создаются с отступлением от схем истинных экспериментов. Исследователь должен осознавать источники артефактов – внешних дополнительных переменных, которые он не может контролировать. Квазиэкспериментальный план применяется тогда, когда применение лучшего плана невозможно.

Систематизированные признаки доэкспериментальных, квазиэкспериментальных планов и планов истинных экспериментов приводятся в нижеследующей таблице.


При описании экспериментальных планов будем пользоваться символизацией, предложенной Д. Кэмпбеллом: R – рандомизация; X – экспериментальное воздействие; O – тестирование.

К доэксперименталъным планам относятся: 1) исследование единичного случая; 2) план с предварительным и итоговым тестированием одной группы; 3) сравнение статистических групп.

При исследовании единичного случая однократно тестируется одна группа после экспериментального воздействия. Схематично этот план можно записать в виде:

Контроль внешних переменных и независимой переменной полностью отсутствует. В таком эксперименте нет никакого материала для сравнения. Результаты могут быть сопоставлены лишь с обыденными представлениями о реальности, научной информации они не несут.

План с предварительным и итоговым тестированием одной группы часто применяется в социологических, социально-психологических и педагогических исследованиях. Его можно записать в виде:

В этом плане отсутствует контрольная группа, поэтому нельзя утверждать, что изменения зависимой переменной (разница между O1 и O2), регистрируемые в ходе тестирования, вызваны именно изменением независимой переменной. Между начальным и итоговым тестированием могут произойти и другие «фоновые» события, воздействующие на испытуемых вместе с независимой переменной. Этот план не позволяет контролировать также эффект естественного развития и эффект тестирования.

Сравнение статистических групп будет точнее назвать планом для двух неэквивалентных групп с тестированием после воздействия. Он может быть записан в таком виде:

Этот план позволяет учитывать эффект тестирования, благодаря введению контрольной группы контролировать ряд внешних переменных. Однако с его помощью невозможно учесть эффект естественного развития, так как нет материала для сравнения состояния испытуемых на данный момент с их начальным состоянием (предварительное тестирование не проводилось). Для сравнения результатов контрольной и экспериментальной групп используют t-критерий Стьюдента. Однако следует учитывать, что различия в результатах тестирования могут быть обусловлены не экспериментальным воздействием, а различием в составе групп.

Квазиэкспериментальные планы являются своеобразным компромиссом между реальностью и строгими рамками истинных экспериментов. Существуют следующие типы квазиэкспериментальных планов в психологическом исследовании: 1) планы экспериментов для неэквивалентных групп; 2) планы с предварительным и итоговым тестированием различных рандомизированных групп; 3) планы дискретных временных серий.

План эксперимента для неэквивалентных групп направлен на установление причинно-следственной зависимости между переменными, однако в нем отсутствует процедура уравнивания групп (рандомизация). Этот план может быть представлен следующей схемой:

К проведению эксперимента в данном случае привлекаются две реальные группы. Обе группы тестируются. Затем одна группа подвергается экспериментальному воздействию, а другая – нет. Затем обе группы повторно тестируются. Результаты первого и второго тестирования обеих групп сопоставляют, для сравнения используют t-критерий Стьюдента и дисперсионный анализ. Различие O2 и O4 свидетельствует о естественном развитии и фоновом воздействии. Для выявления действия независимой переменной необходимо сравнивать 6(O1 O2) и 6(O3 O4), т. е. величины сдвигов показателей. Значимость различия приростов показателей будет свидетельствовать о влиянии независимой переменной на зависимую. Этот план аналогичен плану истинного эксперимента для двух групп с тестированием до и после воздействия (см. с. 118). Главным источником артефактов является различие в составе групп.

План с предварительным и итоговым тестированием различных рандомизированных групп отличается от плана истинного эксперимента тем, что предварительное тестирование проходит одна группа, а итоговое – эквивалентная группа, которая подверглась воздействию:

Главный недостаток этого квазиэкспериментального плана – невозможность контролировать эффект «фона» – влияние событий, происходящих наряду с экспериментальным воздействием в период между первым и вторым тестированием.

Планы дискретных временных серий подразделяются на несколько видов в зависимости от количества групп (одной или нескольких), а также в зависимости от количества экспериментальных воздействий (одиночного или серии воздействий).

План дискретных временных серий для одной группы испытуемых состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем применяют экспериментальное воздействие и проводят серию аналогичных замеров. Сравнивают уровни зависимой переменной до и после воздействия. Схема этого плана:

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фоновых событий, которые происходят в течение исследования.

Модификацией этого плана является квазиэксперимент по схеме временных серий, в котором воздействие перед замером чередуется с отсутствием воздействия перед замером. Его схема такова:

ХO1 – O2ХO3 – O4 ХO5

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, полученных в эксперименте, серии разбивают на две последовательности и сравнивают результаты замеров, где было воздействие, с результатами замеров, где оно отсутствовало. Для сравнения данных используется t-критерий Стьюдента с числом степеней свободы n – 2, где n – число ситуаций одного типа.

Планы временных серий часто реализуются на практике. Однако при их применении нередко наблюдается так называемый «эффект Хотторна». Впервые его обнаружили американские ученые в 1939 г., когда проводили исследование на заводе Хотторна в Чикаго. Предполагалось, что изменение системы организации труда позволит повысить его производительность. Однако в ходе эксперимента любые изменения в организации труда приводили к повышению его производительности. В результате оказалось, что само по себе участие в эксперименте повысило мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы контролировать этот эффект, должна использоваться контрольная группа.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

O1O2O3O4O5O6O7O8O9O10

O1O2O3O4O5O6O7O8O9O10

Такой план позволяет контролировать эффект «фона». Обычно он используется исследователями при изучении реальных групп в образовательных учреждениях, клиниках, на производстве.

Еще один специфический план, который нередко используется в психологии, называют экспериментом ex-post-facto. Он часто применяется в социологии, педагогике, а также в нейропсихологии и клинической психологии. Стратегия применения этого плана состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия выступает некоторое реальное событие из их жизни. Экспериментальная группа состоит из «испытуемых», подвергшихся воздействию, а контрольная группа – из людей, не испытавших его. При этом группы по возможности уравниваются на момент своего состояния до воздействия. Затем проводится тестирование зависимой переменной у представителей экспериментальной и контрольной групп. Данные, полученные в результате тестирования, сопоставляются и делается вывод о влиянии воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием и тестированием после воздействия. Его схема такова:

Если удается достичь эквивалентности групп, то этот план становится планом истинного эксперимента. Он реализуется во многих современных исследованиях. Например, при изучении посттравматического стресса, когда люди, перенесшие воздействия природной или техногенной катастрофы, или участники боевых действий тестируются на наличие посттравматического синдрома, их результаты сопоставляются с результатами контрольной группы, что позволяет выявить механизмы возникновения подобных реакций. В нейропсихологии травмы головного мозга, поражения определенных структур, рассматриваемые как «экспериментальное воздействие», предоставляют уникальную возможность для выявления локализации психических функций.

Планы истинных экспериментов для одной независимой переменной отличаются от других следующим:

1) использованием стратегий создания эквивалентных групп (рандомизация);

2) наличием как минимум одной экспериментальной и одной контрольной групп;

3) итоговым тестированием и сравнением результатов групп, получавших и не получавших воздействие.

Рассмотрим подробнее некоторые экспериментальные планы для одной независимой переменной.

План для двух рандомизированных групп с тестированием после воздействия. Его схема выглядит так:

Этот план применяют в том случае, если нет возможности или необходимости проводить предварительное тестирование. При равенстве экспериментальной и контрольной групп данный план является наилучшим, поскольку позволяет контролировать большинство источников артефактов. Отсутствие предварительного тестирования исключает как эффект взаимодействия процедуры тестирования и экспериментального задания, так и сам эффект тестирования. План позволяет контролировать влияние состава групп, стихийного выбывания, влияние фона и естественного развития, взаимодействие состава группы с другими факторами.

В рассмотренном примере использовался один уровень воздействия независимой переменной. Если же она имеет несколько уровней, то количество экспериментальных групп увеличивается до числа уровней независимой переменной.

План для двух рандомизированных групп с предварительным и итоговым тестированием. Схема плана выглядит следующим образом:

R O1 Х O2

Этот план применяется в том случае, если существуют сомнения в результатах рандомизации. Главный источник артефактов – взаимодействие тестирования и экспериментального воздействия. В реальности также приходится сталкиваться с эффектом неодновременности тестирования. Поэтому наилучшим считается проведение тестирования членов экспериментальной и контрольной групп в случайном порядке. Предъявление-непредъявление экспериментального воздействия также лучше проводить в случайном порядке. Д. Кэмпбелл отмечает необходимость контроля «внутригрупповых событий». Данный экспериментальный план хорошо контролирует эффект фона и эффект естественного развития.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляют три значения t: 1) между O1 и O2; 2) между O3 и O4; 3) между O2 и O4. Гипотезу о значимости влияния независимой переменной на зависимую можно принять в том случае, если выполняются два условия: 1) различия между O1 и O2 значимы, а между O3 и O4 незначимы и 2) различия между O2 и O4 значимы. Иногда удобнее сравнивать не абсолютные значения, а величины прироста показателей б(1 2) и б (3 4). Эти значения также сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую.

План Соломона представляет собой объединение двух предыдущих планов. Для его реализации необходимы две экспериментальные (Э) и две контрольные (К) группы. Его схема выглядит так:

С помощью этого плана можно контролировать эффект взаимодействия предварительного тестирования и эффект экспериментального воздействия. Эффект экспериментального воздействия выявляется при сравнении показателей: O1 и O2; O2 и O4; O5 и O6; O5 и O3. Сравнение O6, O1 и O3 позволяет выявить влияние фактора естественного развития и фоновых воздействий на зависимую переменную.

Теперь рассмотрим план для одной независимой переменной и нескольких групп.

План для трех рандомизированных групп и трех уровней независимой переменной применяется в тех случаях, когда необходимо выявление количественных зависимостей между независимой и зависимой переменными. Его схема выглядит так:

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. При необходимости можно увеличить количество экспериментальных групп в соответствии с количеством уровней независимой переменной. Для обработки данных, полученных с помощью такого экспериментального плана, могут применяться все вышеперечисленные статистические методы.

Факторные экспериментальные планы применяются для проверки сложных гипотез о взаимосвязях между переменными. В факторном эксперименте проверяются, как правило, два типа гипотез: 1) гипотезы о раздельном влиянии каждой из независимых переменных; 2) гипотезы о взаимодействии переменных. Факторный план заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп при этом равно числу сочетаний.

Факторный план для двух независимых переменных и двух уровней (2 х 2). Это наиболее простой из факторных планов. Его схема выглядит так.



Данный план выявляет эффект воздействия двух независимых переменных на одну зависимую. Экспериментатор сочетает возможные переменные и уровни. Иногда используются четыре независимые рандомизированные экспериментальные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.

Существуют более сложные версии факторного плана: 3 х 2 и 3 х 3 и т. д. Дополнение каждого уровня независимой переменной увеличивает число экспериментальных групп.

«Латинский квадрат». Является упрощением полного плана для трех независимых переменных, имеющих два и более уровней. Принцип латинского квадрата состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым значительно сокращаются количество групп и экспериментальная выборка в целом.

Например, для трех независимых переменных (L, M, N) с тремя уровнями у каждой (1, 2, 3 и N(A, В, С)) план по методу «латинского квадрата» будет выглядеть так.

В этом случае уровень третьей независимой переменной (А, В, С) встречается в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных. Применение латинских букв А, В, С для обозначения уровней третьей переменной традиционно, поэтому метод и получил название «латинский квадрат».

«Греко-латинский квадрат». Этот план применяется в случае, если необходимо исследовать влияние четырех независимых переменных. Он строится на основе латинского квадрата для трех переменных, при этом к каждой латинской группе плана присоединяется греческая буква, обозначающая уровни четвертой переменной. Схема для плана с четырьмя независимыми переменными, каждая из которых имеет три уровня, будет выглядеть так:

Для обработки данных, полученных в плане «греко-латинский квадрат», применяется метод дисперсионного анализа по Фишеру.

Главная проблема, которую позволяют решить факторные планы, – определение взаимодействия двух и более переменных. Эту задачу невозможно решить, применяя несколько обычных экспериментов с одной независимой переменной. В факторном плане вместо попыток «очистить» экспериментальную ситуацию от дополнительных переменных (с угрозой для внешней валидности) экспериментатор приближает ее к реальности, вводя некоторые дополнительные переменные в разряд независимых. При этом анализ связей между изучаемыми признаками позволяет выявить скрытые структурные факторы, от которых зависят параметры измеряемой переменной.

4.8. Корреляционные исследования

Теория корреляционного исследования разработана английским математиком К. Пирсоном. Стратегия проведения такого исследования заключается в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследователь выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида. При этом предположение о причинной зависимости не обсуждается.

Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя или более) переменными. В психологии в качестве переменных могут выступать психические свойства, процессы, состояния и т. п.

Корреляционные связи. «Корреляция» в прямом переводе означает соотношение. Если изменение одной переменной сопровождается изменением другой, то говорят о корреляции этих переменных. Наличие корреляции двух переменных не является свидетельством наличия причинно-следственных зависимостей между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие корреляции позволяет опровергнуть гипотезу о причинно-следственной связи переменных.

Различают несколько типов корреляционных связей:

Прямая корреляционная связь (уровень одной переменной непосредственно соответствует уровню другой переменной);

Корреляция, обусловленная третьей переменной (уровень одной переменной соответствует уровню другой переменной в силу того, что обе эти переменные обусловлены третьей, общей переменной);

Случайная корреляция (не обусловлена никакой переменной);

Корреляция, обусловленная неоднородностью выборки (если выборка состоит двух неоднородных групп, то может быть получена корреляционная связь, не существующая в генеральной совокупности).

Корреляционные связи бывают следующих видов:

– положительная корреляция (повышение уровня одной переменной сопровождается повышением уровня другой переменной);

– отрицательная корреляция (рост уровня одной переменной сопровождается снижением уровня другой);

– нулевая корреляция (свидетельствует об отсутствии связи переменных);

– нелинейная связь (в определенных пределах повышение уровня одной переменной сопровождается повышением уровня другой, а при других параметрах – наоборот. Большинство психологических переменных имеют именно нелинейную связь).

Планирование корреляционного исследования. План корреляционного исследования является разновидностью квазиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. Корреляционное исследование разбивается на серию независимых измерений в группе испытуемых. В случае простого корреляционного исследования группа однородна. В случае сравнительного корреляционного исследования мы имеем несколько подгрупп, различающихся по одному или нескольким критериям. Результаты таких измерений дают матрицу вида Р х О. Обрабатываются данные корреляционного исследования путем вычисления корреляций по строкам или по столбцам матрицы. Корреляция по строкам дает сравнение испытуемых. Корреляция столбцов дает информацию о связи измеряемых переменных. Часто выявляются временные корреляции, т. е. изменение структуры корреляций во времени.

Ниже рассмотрены основные типы корреляционного исследования.

Сравнение двух групп. Применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного параметра. Средние результаты у двух групп сравнивают с помощью t-критерия Стьюдента. При необходимости для сравнения дисперсий показателя в двух группах также может быть использован t-критерий Фишера (см. 7.3).

Одномерное исследование одной группы в разных условиях. План этого исследования близок к экспериментальному. Но в случае корреляционного исследования мы не управляем независимой переменной, а лишь констатируем изменение поведения индивида в разных условиях.

Корреляционное исследование попарно эквивалентных групп. Этот план используется при исследовании близнецов методом внутрипарных корреляций. Близнецовый метод основывается на следующих положениях: генотипы монозиготных близнецов сходны на 100 %, а дизиготных близнецов – на 50 %, среда развития как дизиготных, так и монозиготных пар одинакова. Дизиготные и монозиготные близнецы разбиваются на группы: в каждой – один близнец из пары. У близнецов обеих групп измеряется интересующий исследователя параметр. Затем вычисляются корреляции между параметрами -корреляция) и между близнецами -корреляция). Сравнивая внутрипарные корреляции монозиготных и дизиготных близнецов, можно выявить доли влияния среды и генотипа на развитие того или иного признака. Если корреляция монозиготных близнецов надежно выше корреляции дизиготных близнецов, то можно говорить о существующей генетической детерминации признака, в противном случае говорят о средовой детерминации.

Многомерное корреляционное исследование. Проводится для проверки гипотезы о связи нескольких переменных. Отбирается экспериментальная группа, которая тестируется по определенной программе, состоящей из нескольких тестов. Данные исследования заносятся в таблицу «сырых» данных. Затем эта таблица обрабатывается, подсчитываются коэффициенты линейных корреляций. Корреляции оцениваются на статистические различия.

Структурное корреляционное исследование. Исследователь выявляет различие в уровне корреляционных зависимостей между одними и теми же показателями, измеренными у представителей разных групп.

Лонгитюдное корреляционное исследование. Оно строится по плану временных серий с тестированием группы через заданные промежутки времени. В отличие от простого лонгитюда исследователя интересуют изменения не столько самих переменных, сколько связей между ними.

эксперт по системному бизнесу

«Экспериментатор должен относиться к теории, как к хорошенькой женщине: с благодарностью принимать то, что она ему даёт, но не доверять ей безрассудно»

Лев Арцимович

кому: собственникам, топ-менеджерам и руководителям


Сценарии использования статьи: кому полезна и почему

Собственникам, топ-менеджерам - перейти от “чёрного ящика” в развитии компании к технологии экспериментов, которая позволяет минимизировать возможные риски и убытки от нововведений.

Руководители среднего звена - организовать внедрение новых технологий и бизнес-процессов в компании и поступательное их развитие.

Сотрудники, специалисты - получить технологию, действуя и опираясь на которую можно одновременно строить свою горизонтальную карьеру, наращивать профессионализм и быть на хорошем счету в компании.

«Не зная броду, не суйся в воду», или Как поспешные решения разрушают бизнес

В наших национальных традициях управления бросаться руководителю в две крайности: первая - идти напролом, “наломать дров” и расхлёбывать последствия в виде серьёзных убытков; вторая - быть гипер-осторожным, ничего не менять и в итоге получить деградацию компании / подразделения.

Первые (я называю их “руководителями-поджигателями”) действуют по принципу “всё или ничего”. Это люди, которые начинают активно внедрять масштабные изменения или проекты, как только им приходит такая идея. Казалось бы, что может быть лучше, чем быстрый переход от идеи/разговоров к действию? Но дьявол, как известно, в деталях.

На практике быстрые “рывки” с целью решить большую и/или сложную задачу зачастую заканчиваются “пшиком” (а вы пробовали поднять 200-килограммовую гирю рывком?) Нет ничего хуже для устойчивости бизнеса, чем пренебрегать принципом “не зная броду, не суйся в воду”.

Негативные последствия тактики “давайте внедрим всё и сразу”:

  • Приходится слишком долго ждать достижения результата. За это время руководитель и участники проекта устают морально и физически, и бросают начатое дело на полпути, даже если процесс выполнен уже на 80%.
  • В ходе работы участники сталкиваются с подводными камнями (просчётами), которые крайне тяжело или невозможно быстро преодолеть, и столкновение с которыми приносит значительные убытки (вначале лучше проплыть на лодке и составить карту рифов, а затем уже отправлять корабль, в крайнем случае - потеряете только лодку).
  • Пока идёт внедрение, люди ещё не научились работать по-новому, но уже перестали работать по-старому. Поскольку в процесс втянуты все сразу, возникает дезорганизация (когда есть нарушители правил не по своей воле). Производительность труда и качество результата резко падает.
  • Приняв один раз решение и затратив большие ресурсы на внедрение, руководитель боится потерять свой авторитет (или навлечь гнев со стороны вышестоящего начальства) и вынужден "топить за него", даже видя неэффективность задумки. Разумно полагая, что масштабные просчёты так просто не прощаются, он продолжает вливать ресурсы компании в “мёртвый” проект.

«Не трогай то, что хорошо работает» и обреки свою компанию на медленное умирание

Есть и вторая крайность в работе руководителей (таких я называю “руководителями-улитками”), особенно актуальная для компаний, где сильны правила и регламенты. Так как процессы работают на “хорошо”, то их не трогают, руководствуясь принципом “не трогай то, что хорошо работает”.

С внедрением системы регламентов (при условии, что они исполняются, естественно) компания теряет гибкость и скорость. В условиях постоянно меняющегося рынка думаю понятно, что это сродни смертному приговору.

Негативные последствия тактики “не трогай то, что хорошо работает”:

  • Деградация процессов и системы регламентов на фоне внешних и внутренних изменений. Потеря конкурентоспособности компании и, как следствие, отток клиентов, убытки .
  • Сотрудники теряют навыки решения нестандартных задач. Единственный, кто может их ещё худо-бедно решить - руководитель. В результата на него возрастает нагрузка.
  • Профессионалы демотивированы и постепенно покидают компанию, так как нет возможности горизонтального роста - “как работали 3 года назад, так работаем и сейчас”.
  • Постепенно нарастает разница между “как надо” и “как написано в регламенте”, что в конечном итоге сводит на нет все преимущества системы регламентов (рекомендую статью ).


Но без системы регламентов едва ли возможны стандартизированное управление, повышение качества работы, накопление в компании знаний, сокращение издержек и убытков от повторяющихся “проблем”. Ситуация, на первый взгляд, патовая: без системы регламентов жить невозможно, но вместе с ней компания может потерять гибкость и перестанет развиваться.

Как с помощью эксперимента уйти от крайностей

Возникает резонный вопрос: “Можно ли руководителю избежать негативных крайностей и если да, то каким образом”? Мой ответ - управляйте развитием технологий, регламентов и процессов в вашей компании с помощью экспериментов.

На первый взгляд создаётся впечатление, что речь идёт об очевидных вещах. Слово “эксперимент” мы знаем все. Но во многих ли компаниях используют эксперименты на уровне отработанного алгоритма для создания и развития технологий, регламентов и процессов? Чтобы ответить на этот вопрос, предлагаю своё видение сути эксперимента.

Эксперимент - возможность проверить гипотезу “малой кровью”

Гипотеза - предположение о способе решения управленческой или какой-либо другой задачи с достижением требуемых: целей и качества результата (пример гипотезы: ввести KPI для менеджеров, чтобы они лучше работали над клиентскими проектами).

Эксперимент может быть управленческим, если руководитель тестирует какую-либо управленческую технологию (например, учёт времени по задачам), а может быть связан и с любыми другими задачами, связанными с внедрением нового или доработкой уже существующего процесса, регламента, технологии и т.д.

Ключевые принципы использования экспериментов в работе

  1. Рассматривайте как эксперимент любые изменения : ввод новой системы бонусов, дополнения или отмена каких-либо внутренних правил компании, перевод сотрудника на новую должность.
  2. Формируйте ожидания участников эксперимента . Сразу оговаривайте с участниками или с теми, кого касается эксперимент, что условия могут быть пересмотрены по результатам эксперимента.
  3. Привлекайте к экспериментам сотрудников. Развивать процессы и регламенты - это обязанность каждого сотрудника, работающего с ними. Его профессиональная пригодность оценивается и степенью участия в этом процессе. Поэтому компании. А для руководителей - это одна из базовых управленческих компетенций.
  4. Организуйте и формализуйте сбор идей по улучшению регламентов и процессов от сотрудников и обработку их (как организовать - расскажу в одной из следующих статей). Далеко не всегда есть возможность провести эксперимент сразу, как только возникла идея.
  5. Продумайте, у кого из сотрудников могут быть полномочия на проведение экспериментов самостоятельно (возможно, в рамках определённых ресурсов, например, если суммарное время участников на выполнение эксперимента не превышает 10 часов), а кто вначале должен согласовать с руководителем. Для разных категорий экспериментов могут быть разные полномочия и ограничения. Например, начальнику отдела контекстной рекламы запрещено проводить управленческие эксперименты без согласования с вышестоящим руководителям, а эксперимент, связанный с процессом работы, может быть выполнен самостоятельно, если затраты на него не превышают 2000 рублей.
  6. Создайте и ведите таблицу экспериментов (или базу данных), для того чтобы:
    • Руководитель мог оценить качество работы и активность сотрудников: какие эксперименты они проводят? Как пользуются полномочиями? На каких стадиях находятся эксперименты и какие результаты по ним достигнуты?
    • Различать случаи, когда имеет место проведение эксперимента, а когда нарушение установленных правил.
    • Избежать дублирования экспериментов, а также повторения неудачных.
    • Дать возможность сотрудникам следить за экспериментами, которые решают их задачи, и использовать промежуточные результаты для пользы дела.

Технология проведения экспериментов

Прежде чем менять всё, сделайте эксперимент на узком участке (пилотный проект). Внедряете планы и отчёты (регламенты, KPI и т.д.) для сотрудников? Начните с одного отдела.

Полученный опыт значительно упростит задачу по внедрению этого же инструмента для всех остальных (вы узнаете о подводных камнях; научитесь отрабатывать возражения сотрудников и "продавать" им технологию; остальные получат образец "да, это возможно и работает!"). Да и ошибки, и промахи, допущенные на узком участке, не подорвут ваш авторитет, а могут быть использованы для его роста.


Многие руководители по прежнему надеются на чудо, когда затевают масштабное нововведение без предварительного проведения эксперимента

Это если совсем кратко. А теперь познакомьтесь с подробной версией технологии проведения экспериментов.

1. Опишите задачу

Задача может вытекать из какой-либо существующей или потенциальной проблемы или возможности. При этом важно не забывать о целях. Например, собственник компании считает, что есть возможность увеличить эффективность работы офисных сотрудников. Цель - сокращение издержек компании, увеличение прибыли на одного работающего сотрудника.

2. Сформулируйте гипотезу (вариант) решения задачи и цель эксперимента

Цели эксперимента могут выходить за рамки решения задачи. Например, может стоять цель обучения одного из его участников эксперимента или попутного опробования какой-либо технологии т.д. Желательно, чтобы дополнительные цели решались попутно, с минимальным привлечением каких-либо ресурсов. В противном случае лучше сконцентироваться только на одной цели - получить практический опыт решения задачи выбранным способом.

От качества гипотезы напрямую зависит вероятность успешности эксперимента. Поэтому для её формирования: привлекайте специалистов, сторонних экспертов, изучайте тематические статьи в интернете и литературу.

3. Выберите узкий участок

Решение по выбору узкого участка сравнимо с проходом “между Сциллой и Харибдой”. Чем более ограничен участок, тем меньше ресурсов будет затрачено на эксперимент, но при этом может пострадать достоверность эксперимента.

Есть способ ещё больше сократить затраты на эксперимент! Если работу на узком участке возможно разбить на несколько однотипных действий, в таком случае нет смысла проводить эксперимент, выполняя их все. Проведите только с одним из действий! Если при этом достоверность становится неприемлемой, можно выбрать для эксперимента только ключевые действия.

Например, есть задача создать систему оценки компетенций сотрудников. Для каждой должности около десятка компетенций, каждая из которых оценивается по 5-ти балльной шкале. Задача: проверить насколько эффективна на практике предлагаемая система оценки.

Для эксперимента выбираем узкий участок в виде одной должности и одного человека. Можно ли ещё сузить? Да! Выбрать 2-3 ключевых компетенций для этой должности (здесь оценка разных компетенций - однотипные действия) и оценить по ним выбранного сотрудника.

4. Оцените достоверность результатов эксперимента

Достоверность результатов эксперимента - это параметр, который показывает, можно ли опираясь на полученные результаты, сделать с высокой вероятностью вывод о других однотипных действиях и участках применения нововведения (собственно, ради чего и проводится эксперимент!).

Едва ли удастся доказать достоверность математически, а вот провести устные или мысленные рассуждения вполне по силам. В этом поможет выписанный список факторов, которые могут негативно повлиять на достоверность. Как правило в него входят: 1) участники эксперимента и их компетенции, связанные с тематикой эксперимента; 2) особенности проверяемой технологии.

Например, если рабочие отчёты внедряются только на одном сотруднике, может оказаться, что человек, выбранный для эксперимента, не лоялен к компании, что безусловно повлияет на достоверность результатов.

Ещё один пример. Разрабатывается система оценки сотрудников с помощью профессиональных вопросов. Но их задаёт неподготовленный специалист, который не способен задавать уточняющие вопросы в зависимости от полученных ответов. Едва ли можно назвать результаты такого эксперимента достоверными.

5. Взвесьте затраты и выгоды

Оцените (в письменном виде, естественно) ресурсы, требуемые на эксперимент, риски (часть из них была изучена на этапе оценки достоверности эксперимента), компетенции участников эксперимента в его предметной области. Выпишите возможности и выгоды, которые могут быть получены. Взвесьте и примите решение: а стоит ли овчинка выделки?

Возможно окажется, что прогнозируемая полезность результатов стремится к нулю: как эксперимента, так и решения всей задачи, ради которой он затевался (для задачи это нужно было выяснить на этапе составления сценариев!)

Например, в рекламной кампании клиента, для того чтобы получить больше заявок из социальных сетей, необходимо провести эксперимент по расширению целевой аудитории (например, добавить в неё менеджеров среднего звена): собрать аудиторию; запустить несколько рекламных объявлений для аудитории и посмотреть с помощью систем аналитики совершают ли привлечённые посетители целевые действия (например, отправка заявки на звонок, подписка на рассылку). Стоимость эксперимента 30.000 руб, но при этом выгода от привлечённых клиентов значительно больше, ведь если аудитория “выстрелит”, её можно использовать в рекламе много лет.

6. Составьте план эксперимента, определите участников и распределите роли между ними

При составлении плана обязательно учтите, что во время проведения эксперимента, если речь идёт об улучшении какой-либо технологии, необходимо ещё продумать способы предотвращения конфликта между двумя процессами: старым и новым (именно поэтому важно минимизировать количество участников в рамках эксперимента!)

Например, сейчас менеджеры в компании используют Excel-таблицы для ведения клиентской базы. Топ-менеджеры решили внедрить CRM. Прежде чем приступать к эксперименту, рекомендую ответить на 2 важных вопроса:

  1. Как и кем будут перенесены контакты и история общения с клиентами из CRM в Excel в случае провала эксперимента?
  2. Как будут перенесены данные из таблиц в CRM в случае успеха эксперимента?

У эксперимента, как и у любой задачи, должен быть руководитель, который несёт всю полноту ответственности за его результаты (напоминаю, что ответственность появляется там, где предоставляются полномочия). Необходимо подобрать участников эксперимента, исходя из всех описанных выше пунктов.

Если план получился слишком громоздким, то может быть есть возможность разделить эксперимент на 2 или 3 более мелких и простых?

7. Проведите эксперимент, зафиксируйте итоги

Помните, что при проведении эксперимента руководителю необходимо: отработать технологию выполнения задачи и получения результатов, обучить ключевых участников, найти “подводные камни” и проблемы, разыскать дополнительные возможности, замерить время на выполнение задач эксперимента.

Всё найденное необходимо фиксировать в письменном виде: в общей таблице или отдельном ЛОГ-файле - зависит от масштаба эксперимента.

8. Проанализируйте полученные результаты, сделайте выводы по итогам

Анализируйте и оценивайте всё, что замерялось и фиксировалось в предыдущем пункте. Оцените возможное влияние роста масштаба применения технологии на практике (сложность, бюджеты, синергия, риски и т.д.), подключения к эксперименту новых участников.


Постарайтесь найти и отметить факторы, которые привели эксперимент к успеху или наоборот стали причиной его провала (речь идёт именно о неудачно проведённом эксперименте, но не об опровержении гипотезы). В этом случае скорее всего эксперимент необходимо повторить, ибо его результат не является достоверным, но уже скорректировав параметры: участников, план эксперимента, руководителя, ресурсы, цели и т.д.

Отрицательный результат - это тоже очень хороший результат, когда речь идёт об опровержении выдвинутой гипотезы с помощью эксперимента (да, и такие задачи бывают!) Негативный результат на маленьком участке сбережёт от катастрофы масштаба компании.

Но здесь очень важно отличать причины отрицательного результата, связанные с организацией и проведением эксперимента, от ошибочной гипотезы.

9. Расширьте участок эксперимента в случае необходимости

Взбираясь по крутой лестнице, перепрыгивать через несколько ступенек - опасная затея. Аналогично и во внедрении новых технологий.

В случае масштабных или сложных изменений, рекомендую по итогам успешного эксперимента расширять участок, т.е. увеличивать масштаб эксперимента с обязательным привлечением получивших опыт участников. Как правило, увеличивают количество однотипных действий, количество участников эксперимента, количество копий процессов и т.д.

Если нет необходимости расширять участок и эксперимент признан успешным - запланируйте полномасштабное внедрение. В организации процесса внедрения вам поможет информация из упоминаемой ранее статьи про управление проектами.

Мысленный эксперимент - возможность сэкономить ресурсы

Мысленный эксперимент не требует привлечения каких-либо ресурсов, кроме людских и временных. Выполняется с помощью рассуждений в любом удобном формате: устно или письменно, с экспертами и/или квалифицированными участниками.

Возможно, при проведении мысленного эксперимента потребуется письменно зафиксировать информацию для некоторых этапов подготовки из алгоритма.

Рекомендую проводить предварительно мысленный эксперимент каждый раз, когда вы хотите что-то изменить. Это позволяет отсечь часть нежизнеспособных идей без затрат ресурсов, но, к сожалению, редко помогает убедиться в правильности гипотезы.

Сценарии применения экспериментов в жизни

Подтверждение качества технологии - это возможность применить её в повседневной жизни. Хотите переехать в другую страну ? Если вы проживёте там только неделю, вы не узнаете все плюсы и минусы жизни в ней. Проживите там вначале 1 месяц, а лучше полгода. Тогда узнаете большинство особенностей, возможностей и подводных камней и сможете принять более взвешенное решение. Сколько историй среди моих знакомых: продавали недвижимость, уезжали, а потом возвращались обратно.

Решили купить новую машину ? Возьмите аналогичную на прокат на 1 месяц. Узнаете, насколько она вам подходит.

Нанимаете на работу нового сотрудника ? Дайте возможность ему поработать в вашей компании 1-2 недели до оформления, чтобы и он и вы могли посмотреть, насколько он подходит компании, а компания ему. Если останется, то с большой вероятностью проработает долго. Если всё же решит уйти, то пусть лучше это случится через 5 дней, чем через 2 месяца обучения.

Методика эксперимента

Методика эксперимента – это совокупность способов и приемов его проведения. Методика, которая относится ко всему исследованию, является общей. Для отдельных опытов в пределах данного исследования могут создаваться дополнительные частные методики. Значение частных методик возрастает с увеличением разнообразия явлений, подлежащих изучению.

Методика экспериментального исследования определяет оборудования., количество опытов, план работы, затраты времени и средств.

Построение правильной методики позволяет в кратчайшие сроки и при минимальных экологических и трудовых затратах получить ожиданий от эксперимента результат и избежать появления ненужных опытных данных, из которых никаких выводов сделать нельзя.

Эксперимент может проводиться в пассивной форме (наблюдение без вмешательства в условия развития явления) и активной (создание определенных условий развития явления).

Пассивное наблюдение применяют преимущественно для предварительной проверки общей правильности рабочей гипотезы и установления направления развития явления. При пассивном наблюдении исследователь регистрирует различные интересующие его параметры, характеризующие явление. Для регистрации употребляют разнообразные средства измерений. Пассивное наблюдение можно чередовать с активным.

Наблюдение становится активным, когда исследователь сам определяет условия развития явления в желаемом направлении, чтобы получить ясные закономерности.

Первой ступенью активного наблюдения являются поисковые опыты. Целью поисковых опытов является проверка отдельных частей разработанной методики и приспособленности приборов к тем измерениям, которые определены методикой. В ходе поисковых опытов устанавливают также факторы, определяющие развитие является или отбирают основные факторы. Поисковые опыты можно ставить и для того, чтобы найти основания для расчета числа опытов.

После проведения поисковых опытов все факторы, обусловливающие явления, разделяют на основные, оказывающие наибольшее влияние на развитие явления и несущие наибольшую информацию о нем, и дополнительные, влияющие на развитие явления второстепенно. При постановке опыта измеряют лишь параметры характеризующие основные факторы.

Следует иметь в виде, что данное деление во многом является условным, поскольку при изменении условий опыта дополнительные факторы могут стать основными и наоборот.

Чтобы устранить или по крайней мере уменьшить ошибку, появляющуюся вследствие деления факторов на основные и дополнительные, когда при постановке опытов стремится нейтрализовать дополнительные факторы, т.е. создать такие условия, при которых действие дополнительных факторов было бы возможно более неизменно и незначительно. Исследователь при этом должен стремиться сделать переменными величинами лишь основными факторами. Таким образом, общим принципам исследования является постоянства всех остальных факторов при изменении избранных.

Есть четыре основных приёма нейтрализации дополнительных факторов.

Метод резко изменения переменных факторов при относительно малом изменении остальных. При этом методе основной фактор стараются изменять в наиболее широком диапазоне значений, а изменение остальных минимизировать. Например, при снятии характеристики насоса Q=f(p), или КПД=f(p) желательно максимально широко изменять давление, а второстепенные факторы, такие, как износ машины, влияние вязкости масла, температурного репсима и т.д. свести к минимуму, для чего исследование лучше проводить на равноизношенных машинах (например, при сравнении двух различных типов машин), производить охлаждение РЖ и т.д.

Метод контрольных опытов, когда меняющиеся дополнительные факторы одновременно воздействуют на несколько объектов с различными градациями основного фактора, один из которых считают контрольным (эталонам) и с ним сравнивают все остальные. Например, при исследование влияние присадки к маслу (смазке) на износ подшипников эксперимент может проводится для двух групп подшипников, из которых применена смазка с присадкой, в другой - без. Поскольку в большинстве случаев избежать влияние изменение температурного, нагрузочного и скоростного режима на износ подшипников не удается, то испытывают две группы одновременно в таких меняющихся условиях, собой результаты износа. Групп подшипников для испытаний может быть гораздо больше двух, в каждой из них может использоваться различные присадки или различные ее содержание, причем одна из групп всегда является контрольной (эталонной).

Метод «чистых» опытов . При этом методе стремятся искусственно создать условия, в которых дополнительные факторы не проявлялись бы или не влияли бы при проведении опытов на изменяющиеся основные факторы. Этот метод используют лишь в лабораторных условиях.

Например, в реальных эксплуатационных условиях очень трудно исследовать работу гидросистемы рулевого управления автомобиля, т.к. момент сопротивления повороту управляемых колес постоянно меняется изза наличия неровностей дорожного полотна, различного коэффициента трения на различных его участках и т.д. Кроме того, на величину момента сопротивления повороту управляемых колес при длительном проведении испытаний будут оказывать влияние износ шин, давление воздуха в шинах, изменение массы автомобиля (к примеру, в результате дозаправки топливом) и т.д. Провести точные научные исследования в таких условиях крайне затруднительно, поэтому при испытаниях гидросистемы рулевого управления идеализирует ее взаимодействие внешней средой, искусственно создавая в лабораторных условиях постоянные и точно известные значения сил сопротивления повороту колеса, или, в других случаях, обеспечивая изменения сил сопротивления по определенному закону. Этот же метод «частичных» опытов будет очень подходящим для Воссоздания в лабораторных условиях угловых вибраций и ударных воздействий нужной величины на управляемые колеса автомобиля, имитирующие движение автомобиля по неровностям дороги. В реальных дорожных условиях (вне специальных полигонов) получить подобные возмущения на систему с нужной частотой и амплитудой почти невозможно.

Метод разных знаков состоит в том, что одному и тому же фактору, который невозможно исключить полностью, сначала придают положительное, а затем отрицательное значение, чтобы при вычисление средней величины взаимно погасились ошибки от неучета влияния этого фактора.

Например, при исследовании процесса торможения автомобиля угол уклона дороги в продольном направлении, а также скорость ветра могут привести к ощутимой ошибке. Чтобы исключить ошибку от влияние этих факторов, производят опыты при движении автомобиля в одну, а затем другую (обратную) сторону одного и того же дорожного участка, после чего полученные данные усредняют.

Планирование эксперимента. Количество опытов.

При определении необходимого количества опытов следует руководствоваться двоякого рода положениями.

Во-первых, необходима такое количество опытов, которое достаточно точно выявило бы форму функциональной зависимости двух параметров. Например, положение прямой определяется двумя точками, дуги постоянного радиуса - тремя. Для более сложных кривых количества точек определяется следующим правилом: рассматривая сложную кривую как комбинацию прямых и простых кривых, описывают каждый перегиб кривой по меньшей мере тремя точками, а каждый участок, близкий к прямолинейному – двумя. Для более точного определения численных значений функции рекомендуется каждый перегиб кривой обосновывать как минимум пятью опытами. Кроме того, особо тщательно должны случатся резкие перегибы кривых или скачкообразна изменение развития явления.

Для такого определения количество опытных точек используют графики закономерности рабочей гипотезы. В случае, если закономерность в развития явления заранее неизвестна, опытные точки располагают по оси абсцисе равномерно. В ходе проведения опытов положение этих точек может быть уточнено в соответствии с действительными местами изгибов кривых.

Во – вторых, необходимо учитывать случайные ошибки опыта. Как известно, для уменьшение влияние таких ошибок опыты повторяют и берут среднюю арифметическую. Причем количество необходимых повторений зависит от среднего квадратического отклонения измерений и заданной надежности результата.

Под надежностью опыта будет понимать вероятность получения тех же результатов при новых измерений этой же величины или при повторение опыта в тех же условиях.

Из теории вероятности известно, что чем больше относительные колебание результатов и чем большую надежность опыта желательно получить, тем больше должно быть произведено повторений опыта. Наиболее удобным образом для практического использование эта зависимость установлена В.И. Романовским и представлена в виде таблицы

Необходимое количество опытов (измерений)

Надежность опыта Р.

Для того, чтобы найти по этой таблице необходимое количество опытов, нужно задаться надежностью Р и ошибкой А, взятой в долях среднего квадратического отклонений σ.

Например, при измерений менее точным инструментом какого – либо размера среднее квадратическое отклонение равно 0,9 мм, а более точным – 0,15 мм. Пусть допустимая ошибка измерений при надежности 0,95 должна быть не более 0,3 мм, что составляет 1/3σ при измерение менее точным и 2σ при измерении более точным инструментом. По таблице определим, что в этих условиях требуется более 27 измерений менее точным и только 4 измерения более точным инструментом.

Если среднее квадратическое отклонение результата измерений заранее неизвестно, то такой анализ можно проводить последовательно с проведением опытов по следующей схеме: после каждого измерения, начиная с третьего, вычисляют математическое ожидание и среднее квадратическое отклонение. Как только надежность и вычисление ошибки в доля стандарта σ дают по таблице то количество измерений, которое уже произведено, опыты прекращают.

В те случаях, когда нет нужных данных для определения количества повторяемых опытов, а поисковые опыты требуют не меньших затрат, чем основные, часто принимают тройную повторность опытов как минимальную.

Планирование однофакторных и многофакторных экспериментов.

Под фактором следует понимать переменную величину, предположительно влияющую на результат эксперимента. Фактором может быть давление, расход, вязкость РЖ и т.д.

При планирование однофакторного эксперимента немаловажное значение имеет правильный выбор количество и расположение экспериментальных точек на исследуемой функции. Во многих случаях целесообразно выбрать план эксперимента с одинаковыми интервалами между точками. Однако в зависимости от параметра, по которому берется равный интервал изменение его значений, результат опыта может выглядеть по – разному. Например, при исследовании жидкости на дросселе от скорости ее течения () графики будут иметь вид:

При изменении регулируемой переменной ν через равные промежутки Δν получим график, изображения на рис. а). На участке больших скоростей точек недостаточно, а на участке малых – они в избытке. На рис. б) ситуация выглядит противоположно. Наиболее правильным будет вариант, изображен на рис. в), где между экспериментальными точками заключены одинаковые отрезки ΔS опытной кривой. Однако такой подход затруднителен в расчете и для его реализации необходимо до проведение опытов знать характер исследуемой зависимости.

При выборе между вариантами, изображенными на рис. а) и б) лучше пользоваться критерием относительной точности данных на разных участках исследуемой функции. Например, для гидросистем испытания, проводимые при низком давление или при малой мощности, будут наименее точными. С этих позиции участки кривой, на которых данные вызывают наибольшее сомнение, стараются заполнить большим числом точек. С этой точки зрения вариант, изображенный на рис. а) предпочтительнее.

При планировании многофакторных экспериментов рассматривают два или большее число переменных факторов. Такие эксперименты называются двухфакторными, трехфакторными и т.д.

Если при эксперименте определяется зависимая переменная R, которая является функцией нескольких независимых переменных x,y,z и т.д., то план многофакторного эксперимента состоит в том, что все независимые переменные, кроме одной, полагают постоянными, а это одна переменная изменяется во всем интервале значения, при этом выбор интервала между значениями переменной производится по одному из рассмотренных выше правил. Далее изменяется другая независимая переменная, а все остальные выдерживают постоянными. По существу многофакторный эксперимент представляет собой просто последовательность однофакторных экспериментов. Этот подход позволяет найти такие простые функции, как

R=ax n +by m

план двухфакторного эксперимента, в котором каждый фактор берется на пяти уровнях, схематически можно представить в следующем виде:

уровни переменной у

уровни пере-

меной х 3 * * * * *

Звездочкой обозначены комбинации независимых, при которых должен проводиться эксперимент.

В случае более сложных функций, например таких, как

указанный выше план будет являться очень ограниченным и не позволит определить эти зависимости. В этом случае рассматривают несколько уровней независимых переменных х и у, например:

уровни переменной у

уровни переменной у

уровни пере-

меной х 3 * * * * *

Или, возможно, придется заполнить весь квадрат и провести эксперимент для всех 25 комбинаций переменных х и у.

При планирование эксперимента следует иметь в виду, что он не обязательно должен быть сбалансированных. Это означает, что может выбрать десять уровней переменной х и только три уровня переменной у, если считается, что зависимость R от х является более важной или более сложной.

Кроме того, возможны и другие, более сложные, чем описанный выше, планы, ориентированный на конкретные технические процессы и построенные на основании априорных сведений о характере исследуемой функции.

В главе XV рассмотрены основные вопросы статистической обработки результатов эксперимента: определение наиболее достоверного значения измеряемой величины и погрешности этого значения по нескольким измерениям, оценка достоверности различия двух близких величин, установление достоверной функциональной зависимости между двумя величинами и аппроксимация этой зависимости.

Глава носит вспомогательный характер. Материал в ней изложен в справочной форме, без доказательств. Обоснование и более подробное изложение приведенных методов имеется, например, в .

1. Ошибки эксперимента.

Численные методы часто применяют при математическом моделировании физических и других процессов. Результаты расчетов в этом случае сравнивают с экспериментальными данными и по степени их согласованности судят о качестве выбранной математической модели. Чтобы обоснованно сделать заключение о соответствии или несоответствии, вычислитель должен знать, что такое погрешность эксперимента и как с ней обращаются, а также уметь в случае необходимости провести статистическую обработку первичных данных эксперимента.

Кроме того, задача статистической обработки эксперимента представляет самостоятельный интерес, поскольку она очень важна в тех приложениях, когда или требуется особенно высокая точность (например, уравнивание триангуляционных сетей в геодезии), или разброс отдельных измерений превосходит исследуемый эффект (что нередко встречается в физике элементарных частиц, химии сложных соединений, испытании сельскохозяйственных сортов, медицине и т. д.).

Обычно, чем точнее эксперимент, тем более сложной аппаратуры он требует и дороже обходится. Однако хорошо продуманная математическая обработка результатов в ряде случаев позволяет выявить и частично исключить ошибки измерений; это может оказаться не менее эффективным, чем использование более дорогой и точной аппаратуры. В этой главе будет рассмотрена статистическая обработка, позволяющая существенно уменьшить и аккуратно оценить случайную ошибку измерений.

Ошибки эксперимента условно разбивают на систематические, случайные и грубые; рассмотрим их подробнее.

Систематические ошибки - это те, которые не меняются при многократном повторении данного эксперимента. Примерами таких ошибок являются пренебрежение выталкивающим действием воздуха при точном взвешивании или измерение тока гальванометром, нуль которого неправильно установлен. Различают три вида систематических ошибок.

а) Ошибки известной природы, величину которых можно определить; их называют поправками. Так, при точном взвешивании рассчитывают поправку на выталкивающее действие воздуха и прибавляют ее к измеренной величине. Внесение поправок позволяет существенно уменьшить (или даже практически исключить) ошибки такого рода.

Заметим, что иногда расчет поправок бывает самостоятельной сложной математической задачей. Например, некорректно поставленная задача (14.2) о восстановлении переданного радиосигнала по принятому является, по существу, нахождением поправки на искажение принимающей аппаратуры.

б) Ошибки известного происхождения, но неизвестной величины. К ним относится погрешность измерительных приборов, определяемая их классом точности. Для таких ошибок обычно известна только верхняя граница, а как поправки их учесть нельзя.

в) Ошибки, о существовании которых мы не знаем; например, используется прибор со скрытым дефектом или изношенный, фактическая точность которого существенно хуже, чем обозначено в техническом паспорте.

Для выявления систематических ошибок всех видов обычно заранее отлаживают аппаратуру на эталонных объектах с хорошо известными свойствами.

Случайные ошибки вызываются большим числом факторов, которые при повторении одного и того же эксперимента могут действовать по-разному, причем учесть их влияние практически невозможно. Например, при измерении длины предмета линейка может быть неточно приложена, взгляд наблюдателя может падать не перпендикулярно шкале и т. д.

При многократном повторении эксперимента результат вследствие случайной ошибки будет, различным. Однако такое повторение и соответствующая статистическая обработка позволяют, во-первых, определить величину случайной ошибки и, во-вторых, уменьшить ее. Повторяя измерение достаточное число раз, можно уменьшить случайную ошибку до требуемой величины (целесообразно уменьшать ее до величины 50- 100% от систематической ошибки).

Грубые ошибки - это результат невнимательности наблюдателя, который может записать одну цифру вместо другой.

При единичном измерении грубую ошибку не всегда можно опознать. Но если измерение повторено несколько раз, то при статистической обработке выясняют вероятные пределы случайной ошибки. Измерение, существенно выходящее за полученные пределы, считается грубо ошибочным и не учитывается при окончательной обработке результатов.

Таким образом, если измерение повторено достаточно много раз, то можно практически исключить грубые и случайные ошибки, так что точность ответа будет определяться только систематической ошибкой. Однако во многих приложениях это требуемое число раз оказывается неприемлемо большим, а при реально осуществимом числе повторений случайная ошибка может быть определяющей.

на сайте обзор Eleven Finance pressmed.ru