|
 |
Численные методы в гуманитарных и социальных науках в России и США
Подобно тому как все искусства тяготеют к музыке, все науки стремятся к математике. Джордж Сантаяна
О. В. Митина Канд. психолог. наук, ст. науч. сотр. ф-та психологии МГУ им. М.В. Ломоносова CI - 1996; RSEP - 2003
Отечественные ученые любят цитировать Ландау, в шутку делившего области науки на сверхъестественные (математику), естественные и неестественные (гуманитарные и социальные). Однако это изречение очень точно описывает реальную ситуацию, сложившуюся в российской науке. К математике относятся, как к чему-то сверхсложному, доступному лишь единицам. Школьника, который не может получить выше тройки по алгебре, называют гуманитарием и начинают готовить к поступлению в соответствующий вуз, вместо того, чтобы помочь избавиться от <математико-фобии>, закрепляют ее. И если представители естественных дисциплин еще как-то преодолевают этот барьер, то для психологов, социологов, историков и пр. ситуация кажется запредельной. А ведь математика - это мощный и элегантный инструмент, позволяющий проникнуть и описать суть процесса или явления в любой области знаний. С другой стороны, математики сами старательно пытаются сохранить свой имидж <небожителей>, критически относясь к любому прикладному использованию математического аппарата в <неестественных> науках, доказывают некорректность, нестрогость, неправомерность. Исключение, пожалуй, составляет экономика, исторически открывшая возможность многим математикам стать лауреатами Нобелевской премии. В результате ситуация оказывается довольно плачевной.
На примере собственного опыта[2] могу сказать, что хотя будущие студенты-психологи должны выдержать очень серьезный письменный экзамен по математике, а потом, поступив на факультет, еще пройти целый курс математического анализа, линейной алгебры, теории вероятности и математической статистики, они относятся к этому, как к неминуемому и неоправданному препятствию на пути к заветному диплому, которое надо преодолеть любой ценой и забыть как ночной кошмар. В результатена старших курсах, в период подготовки курсовой и дипломной работы, студенты демонстрируют полную беспомощность, неумение, а часто и нежелание не только обработать свои данные на компьютере, но даже чисто теоретически понять, что же им нужно сделать с тем набором чисел, который они получили в ходе эксперимента. Получив от своего научного руководителя распечатку результатов обработки, студент заботливо подшивает ее в свой диплом, а в случае возникновения у оппонентов или экзаменационной комиссии вопросов по поводу используемых методов и программ ссылается на руководителя как на высшую инстанцию.
Не удивительно, что подобную ситуацию можно увидеть и в статьях в научных журналах и диссертациях, ибо пишут их бывшие студенты. Проводя анализ соответствующих публикаций в биологии и медицине, В.П.Леонов, П.В.Ижевский (ссылка в интернете) указывают, что дежурная ссылка: "статистическая обработка проводилась с использованием персонального компьютера" в сознании многих ученых является гарантией высокого качества полученных результатов исследования ("Компьютер не ошибается!"). И это общая картина для всех гуманитарных и социальных наук.
В США ситуация иная. Быть может, благодаря тому, что первый президент США был по специальности статистиком, именно прикладная статистика является уважаемой дисциплиной. Еще в начале этого века появились такие известные журналы как "Биометрика", "Психометрика", "Технометрика", "Эконометрика". Сейчас подобных журналов выходит сотни. Многочисленные издательства ежегодно публикуют десятки книг по методам анализа данных в гуманитарных и социальных науках. Все эти публикации выполняют не только обучающую функцию, но и формируют потребность в грамотной статистической обработке экспериментальных данных. В большинстве ведущих университетов существуют специальные факультеты статистики, на которых ученые ориентированы именно на прикладные аспекты. Следует отметить, что эти исследователи очень уважительно относятся к теоретическим результам российских математических статистиков и успешно применяют их в конкретных дисциплинах. Как правило, на факультетах каждой специальности работают ученые, которые специализируются именно в количественных методах анализа в данной области: в психологии, образовании, биологии, медицине, истории. антропологии, политологии и т.д. Преподаватели факульета статистики преподают вводные курсы, основы измерений, а уже для старшекурсников и аспирантов лекции и практические занятия ведут специалисты в конкретной области, которые в свою очередь регулярно <для поддержания формы> посещают более сложные курсы факультета статистики.
Самый начальный курс введения в статистические рассуждения основывается на знаниях, полученных в средней школе, и дает представления об описательной статистике и зависимости вычисляемых показателей от размера выборки, об элементах теории вероятности, о биномиальном и нормальном распределении.[3]
После этого следует введение в статистические методы, предполагающее элементарное знакомство с высшей математикой. Хотя в заголовках программ указывается название конкретной специальности, по содержанию они идентичны. Более подробно обсуждая материал начального курса, студенты также учатся грамотно презентировать и интерпретировать полученные данные, узнают, в чем различие между теоретическим и выборочным распределениями, знакомятся с теорией оценивания, построения и проверки статистических гипотез, получают общие представления о регрессионном и корреляционном анализе. Будущие биологи и медики, кроме того, получают представление о параметрическом и непараметрическом анализе данных и дисперсионном анализе.
Те студенты, которые хотят уже на младших курсах получить более глубокие знания, проходят теорию вероятности (вероятностные распределения, операции с одномерными и многомерными случайными переменными), регрессионный анализ (общая линейная модель) и прикладную статистику (анализ вероятностей, распределения, оценки, доверительные интервалы, центральная предельная теорема, проверка гипотез, задачи связанные с одной и двумя выборками, согласованность, таблицы сопряженности, корреляции, дисперсионный анализ, непараметрические методы, выборочные и двухвыборочные задачи, знакомятся с простейшими методами анализа временных рядов. Здесь требуется более глубокое знание математического анализа и линейной алгебры. Программа также влючает основы экспериментального дизайна, дающие представление о типах измеряемых данных, о соответствующих методах анализа, о проблемах, связанных с планированием и проведением эксперимента, с необходимостью учета различных субъективных и объективных факторов при анализе данных. Помимо теории обязательно предполагается работа с конкретными статистическими компьютерными программами. Наиболее употребительны SPSS, SAS, STATA. Студенты анализируют свои собственные данные, учатся писать отчеты в соотвествии с требованиями, предъявляемыми редакциями научных журналов.
На старших курсах студенты изучают многомерную статистику (многомерное шкалирование, класторный, дискриминантный анализ), многомерный дисперсионный и регрессионный анализ, нейронные сети, осваивают технологию работы с категориальными данными (наиболее часто встречающимися в гуманитарных и социальных исследованиях), данными, <далекими от идеала> (например, распределенными не по нормальному закону, неполными данными и т.д.). Предусмотрено обсуждение конкретных примеров из научных статей с анализом сильных и слабых сторон опубликованных работ, а также обязательные устные <защиты> своих практических работ перед коллегами по курсу и преподавателями, дающие опыт ответов на каверзные вопросы, связанные с выбором метода анализа, технологией и пр.
Одной из вершин (хотя и не единственной) в области прикладного анализа данных является структурное моделирование. Эта область оформилась в конце 70-х - начале 80-х годов и, по сути, органично включила в себя все имеющиеся методы статистического анализа данных - от определения простейших показателей до многомерного регрессионного и факторного анализа, получившего здесь естественное развитие и объединение. (Bentler 1995, Byrne 1994, 1998, 2000, Dunn, Everitt, Pickles 1993, Ullman 1995).
Основную гипотезу структурного моделирования можно сформулировать так: что характеристические параметры, которые можно экспериментально измерить, изучая какое-либо явление, функционально зависят от существенно меньшего набора базисных параметров. Задача исследователя состоит в оценке значений этого базиса, проверке статистической гипотезы о соответствии модели экспериментальным данным и анализе возможных альтернативных базисных наборов. (Hoyle 1995, Kline 1998).
Структурное моделирование позволяет соотносить измеряемые в ходе эксперимента переменные с гипотетическими (латентными), созданными самим исследователем на стадии дизайна, выделять различные типы взаимосвязей одних переменных с другими, измерять их и статистически оценивать. Структурные уравнения могут быть наглядно изображены в виде диаграмм путей. Основная идея, лежащая в основе структурного моделирования, заключается в возможности проверки взаимосвязей между переменными на основе сопоставления экспериментальных дисперсий и ковариаций с теоретически предсказанными.
Процесс структурного моделирования состоит из следующих этапов: построение модели (обычно с помощью диаграммы путей), представляющей понимание исследователем зависимостей между переменными; вычисление значений дисперсий и ковариаций переменных в текущей модели на основании входных данных; проверка того, насколько хорошо полученные дисперсии и ковариации удовлетворяют гипотетической модели. Исследователю предоставляются результаты статистического анализа, а также оценки параметров и стандартные ошибки для численных коэффициентов в линейных уравнениях вместе с большим количеством дополнительной диагностической информации; на основании этой информации исследователь решает, хорошо ли текущая модель согласуется с экспериментальными данными, имеет возможность модифицировать ее и просчитать заново. (Maruyama 1997, Randall, Richard, 1996, Raykov, Marcoulides, 2000).
Методы, реализованные в структурном моделировании, позволяют проводить межгрупповой анализ (выделять различия и сходства между выборками по предлагаемой модели), анализировать лонгитюдные данные. В отличие от временных рядов, адекватных при наличии большого количества измерений, структурное моделирование оказывается поистине незаменимым в случае ограниченного числа срезов, наиболее часто встречающегося в гуманитарных и социальных науках.
Однако структурное моделирование - это не волшебная палочка, из ничего создающая красивый результат, его освоение требует хорошей (на уровне высшей школы) статистической подготовки, но главное, что успешное использование этих методов предполагает обязательное наличие априорной гипотезы о структуре явления. Еще на стадии планирования эксперимента исследователь должен четко представлять себе, каким образом измеряемые переменные-признаки - шкалы и гипотетические латентные факторы - связаны друг с другом. Анализ полученных экспериментальных данных подтверждает (или опровергает) гипотезу исследователя, позволяет сравнить несколько альтернативных гипотез. Таким образом, выбирая именно этот метод анализа, исследователь сознательно становится на более сложный путь, предполагающий большую научную добросовестность на этапе планирования эксперимента. Но и полученные результаты заслуживают большего доверия и вызывают гораздо меньше скепсиса со стороны самых взыскательных коллег.
Если открыть любой журнал американской психологической ассоциации, то можно увидеть, что не менее половины экспериментальных исследований проводится с использованием структурного моделирования. Любой психологический конгресс, конференция, в планирование программы которых вовлечена американская психологическая ассоциация, обязательно включает практическую сессию по структурному моделированию. Тоже самое можно сказать о сфере образования, социологии, политологии, экономике (исторически первой области применения этого метода). Постоянно издается множество книг, руководств, с 1994 года выходит специальный ежеквартальный междисциплинарный журнал, в интернете имеется сайт и электронный лист, на котором обсуждаются все связанные с этой проблематикой вопросы. В России такие публикации единичны, и изложение принципов структурного моделирования настолько малоубедительно, что вызывает скорее отторжение, нежели желание их использовать. В результате многие российские исследователи (психологи, социологи), имеющие вкус к современным методам анализа данных и использующие их в своих работах на уровне более сложном, чем простая описательная статистика, все острее ощущают свое отставание в этой области[4]
Говоря об основных идеологах структурного моделирования, можно выделить две ветви - западноевропейскую и американскую. Скандинавский ученый Карл Йореског (Jöreskog 1969) начал развивать это направление в начале 60-ых годов; немного позже, в начале 70-ых американский психотерапевт Питер Бентлер заинтересовался численными методами анализа данных, со свойственной ему дотошностью досконально изучил всю математику и статистику и полностью переключился на развитие идей структурного моделирования (Bentler, Weeks, 1980). В результате в настоящее время существует две традиции практического анализа данных, подкрепленные двумя компьютерными программами (Бентлеровская EQS (Bentler 1995, Byrne 1994) и LISREL Йорескога (Joreskog, Sorbom 1996; Kelloway 1998). Конечно, с точки зрения методологии обе эти программы базируются на одних и тех же принципах, идеях и правилах структурного моделирования, но технологически они различаются и имеют своих сторонников. Кроме того ученик Йорескога Бенд Мютен развивает свою собственную программу Мplus (Muthén, Muthén 1998-2001), которая, по его мнению, должна сочетать в себе все достоинства и LISREL, и EQS. Еще одна программа структурного моделирования создана на базе широко известного в России среди ученых-гуманитариев пакета SPSS. Она называется АМОС (Arbuckle 1997; Byrne 2000), и я упоминаю ее здесь из-за ее возможно большей доступности для российской аудитории.
Литература
Леонов В.П., Ижевский П.В. Применение статистики в медицине и биологии: Анализ публикаций 1990 - 1997 гг. http://Statcourse.By.Ru/Leo/Index.Htm
Arbuckle, J. (1997). Amos User's Guide. Version 3.6. IL, Chicago: SmallWaters Corporation.
Bentler, P.M. (1995). EQS, Structural Equations, Program Manual. CA, Encino: Multivariate Software, Inc.
Bentler, P. M., & Weeks, D. G. (1980). Linear structural equations with latent variables. //Psychometrika, 45, 289-308.
Byrne, B.M., (1994). Structural Equation Modeling with EQS and EQS/WINDOWS : Basic Concepts, Applications, and Programming. NJ: Lawrence Erlbaum Assoc.
Byrne, B.M., (1998). Structural Equation Modeling With Lisrel, Prelis, and Simplis : Basic Concepts, Applications, and Programming (Multivariate Applications Book Series). NJ: Lawrence Erlbaum Assoc.
Byrne, B.M., (2000). Structural Equation Modeling With Amos : Basic Concepts, Applications, and Programming (Multivariate Applications Book Series). NJ: Lawrence Erlbaum Assoc.
Dunn, G. Everitt, B. Pickles A. (1993). Modelling Covariances and Latent Variables Using EQS. N.Y.: Chapman & Hall.
Hoyle, R. H. (Ed.) (1995). Structural Equation Modeling : Concepts, Issues, and Applications. Beverly Hills: Sage.
Jöreskog, K. G. (1969). A general approach to confirmatory maximum likelihood factor analysis. //Psychometrika, 34, 183-202.
Joreskog, K.G., Sorbom, D. (1996) LISREL 8: User's reference guide (2nd ed.) Chicago: Scientific Software International.
Kelloway, E.K. (1998). Using Lisrel for Structural Equation Modeling : A Researcher's Guide. Beverly Hills: Sage.
Kline, R.B. (1998). Principles and Practice of Structural Equation Modeling. Guilford Press
Maruyama, G. (1997). Basics of Structural Equation Modeling. Beverly Hills: Sage.
Muthén, L.K. & Muthén, B. (1998-2001). Mplus User's Guide. Los Angeles, CA: Muthén & Muthén.
Randall, E.S., Richard, G.L. (1996) A Beginner's Guide to Structural Equation Modeling Lawrence Erlbaum Assoc
Raykov, T., Marcoulides, G.A. (2000) A First Course in Structural Equation Modeling. NJ: Lawrence Erlbaum Assoc.
Ullman J.B. (1995). Structural Equation Modeling. In: Tabachnik B.G., Fidell L.S. Using Multivariate Statistics. 3rd edition. NY: HarperCollins College Publisher.
[1] Статья написана в результате работы по гранту Айрекса
[2] Автор более десяти лет преподает дисциплины, связанные с измерениями в психологии на психологическом факультете МГУ им. Ломоносова
[3] Данный краткий обзор релевантных курсов составлен на основе программ Калифорнийского Университета Лос Анжелоса (UCLA), однако отличия между ведущими университетами в этой области не значительны.
[4] В настоящее время автор данной статьи благодаря гранту Айрекса имеет возможность изучать структурное моделирование в Калифорнийском Университе Лос Анжелеса и оптимистично надеется, что пособие на русском языке, написанное в результате этой работы в какой-то мере будет способствовать ликвидации досадного пробела. Кроме того Российскую аудиторию возможно заинтересует адрес упоминавшегося электронного листа по структурного моделированию http://www.bama.ua.edu/archives/semnet.html |