27.03.2025
Психология поиска и заимствований достигла больших успехов в том, как исследователи собирают, анализируют и обрабатывают информацию чужих научных работ, но меньше внимания уделяется улучшению генерации гипотез. Некоторые исследователи по-прежнему полагаются на интуицию, случайные наблюдения или ограниченное чтение литературы, чтобы прийти к единой идее о связи между конструкциями. Хотя этот подход не раз приводил к ценным идеям, он может ограничивать мышление и часто не позволяет создать полную картину происходящего. Однако новые подходы позволяют исследователям забрасывать более широкую сеть. В частности, сокращая затраты и усилия на изучение более широкого набора потенциальных переменных, автоматизированный контент-анализ (т. е. компьютерные методы извлечения признаков из неструктурированных данных) может раскрыть новые идеи и помочь разработать новые теории.
Поведенческая наука весьма продвинулась в том, как исследователи собирают, анализируют и сообщают данные, меньше внимания уделялось улучшению генерации гипотез и, как следствие, разработке теорий. Вместо того, чтобы полагаться на интуицию, случайные наблюдения или выборочное чтение литературы, может быть полезным забрасывание более широкой сети. Автоматизированный контент-анализ может помочь облегчить более систематический исследовательский процесс, который подчёркивает открытие переменных и расстановку приоритетов. Это должно помочь выявить новые и более важные движущие силы явлений реального мира.
За последнее десятилетие опасения по поводу Р-хакинга и фальсификации исследований привели к пересмотру методов сбора и анализа данных. Вместо того, чтобы просто сообщать о результатах, исследователям теперь предлагается предварительно зарегистрировать результаты анализа, продемонстрировать возможность их воспроизведения и рассмотреть возможность использования фиксации в картотеке с присвоением номера публикации. Несмотря на то, что во внутренней части исследовательского процесса (т.е. в том, как исследователи собирают, анализируют и представляют данные), многое изменилось. Но начальная часть, то есть генерация гипотез, осталась в некоторой степени нетронутой. Первоначальные исследовательские идеи часто являются результатом интуиции, случайных наблюдений или прочтения предыдущих работ. За этим следует более систематический обзор литературы, и, если идея все ещё кажется достаточно новой, то её пытаются реализовать. И в таком способе нет ничего плохого - так возникло немало полезных прикладных открытий и изобретений.
Хотя этот (часто дедуктивный) подход в некотором смысле полезен, он может быть довольно узким. Каждый источник генерации гипотез (например, интуиция или обзор литературы) представляет собой предвзятую выборку для удобства. Какова вероятность того, что любые гипотезы, к которым приходят исследователи, являются наиболее интересными, новыми или важными для изучения? Или наилучшим образом объясняют важные явления?
Основываясь на развитии автоматизированного контент-анализа (т.е. компьютерных методов извлечения признаков из текста, изображений, аудио- и видеоданных), разработчики нейросетей предположили, что может быть полезно использовать более широкую сеть охвата при формировании гипотез. Вместо простого выявления какой-либо абстрактной концептуальной взаимосвязи исследователи проявляют все больший интерес к объяснению важных, сложных явлений. Следовательно, вместо того, чтобы сосредотачиваться на том, что уже сделано, или на том, что приходит на ум, необходимо применять лучшие способы генерировать, совершенствовать и развивать новую теорию (а не просто расширять существующие). Нужно параллельно рассматривать множество переменных и оптимизировать, а не удовлетворять их.
Автоматизированный контент-анализ, опираясь на заданные системе признаки, может помочь создать более широкую сеть охвата. В частности, за счёт облегчения исследования (т.е. удешевления и упрощения одновременного изучения нескольких переменных) и выявления взаимосвязей, которые, возможно, не удалось бы создать самостоятельно. Попутно этот подход может увеличить вклад, исключить альтернативные объяснения и помочь выявить более масштабные и последовательные эффекты.
Кто-то считает, что определённая независимая переменная может влиять на другую зависимую переменную (или что какой-либо процесс может частично объяснить влияние на почти сформировавшуюся гипотезу). Очень часто, от недостатка дополнительных данных, учёные или изобретатели разрабатывают эксперимент, чтобы проверить то, что уже было задокументировано в других исследованиях, но информация об этом не дошла до человека (группы учёных). Это является одним из источников ограничений в процессе выбора переменных (т.е. часто основывается на теориях, над которыми исследователь работал в прошлом), но характер самих экспериментов также может быть ограничивающим. Хотя эксперименты отлично подходят для проверки причинно-следственного влияния одной переменной на другую, часто бывает сложно (и дорого) манипулировать многими факторами одновременно. Такое обстоятельство приводит к сокращению набора исследуемых независимых факторов.
В частности, автоматизированный контент-анализ облегчает поиск за счёт снижения сложности и затрат на создание и выполнение предварительного анализа сразу по многим параметрам. Следовательно, вместо того, чтобы сосредотачиваться на бинарном вопросе (например, влияет ли X на Y), это позволяет исследователям задавать более открытые вопросы (например, что делает контент вирусным или как формируются социальные взаимодействия). Для изучения таких (часто наводящих) вопросов можно начать со сбора вторичных данных, которые необходимо будет в нужном формате ввести на сервер для обработки. Это может быть информация о том, сколько раз контент публиковался в Интернете, или о содержании социальных взаимодействий, количества цитирования в других научных работах, а также соответствующая релевантность. Тематическое моделирование позволяет системе выделить ключевые темы или семантическую последовательность дискурса.
Многие специалисты уже знакомы с компьютерными методами извлечения признаков из текстовых документов, но аналогичные подходы могут быть использованы для извлечения аудио, изображений или видео. После извлечения эти функции могут быть использованы различными способами. Они могут использоваться в качестве независимых переменных (например, для того, чтобы проследить связь с зависимой переменной, если таковые имеются), элементов управления (т.е. для исключения ложных корреляций или проверки альтернативных объяснений) или в качестве потенциально опосредованной информации (т.е. для изучения потенциальных базовых процессов).
Несмотря на то, что автоматизированный контент-анализ облегчает поиск более широкой информации, он всё ещё остаётся несколько ограниченным. В конце концов, пользователь по-прежнему решает, какой программный пакет использовать для извлечения функций, поэтому переменные могут быть ограничены тем, какие исходные данные будут включены изначально. Машинное обучение (то есть область искусственного интеллекта, связанная со статистическими алгоритмами, которые могут самостоятельно обучаться на этих данных) может способствовать ещё более неструктурированному исследованию. Такое легко может произойти, если изначально информация была заведена неудачно или просто не вполне релевантной тематике исследования. Но часто в таких случаях бывают приятные неожиданности - вместо того чтобы полагаться на существующие признаки исследователи могут обнаружить новые признаки и, следовательно, новые взаимосвязи, которые, возможно, ранее не рассматривались даже теоретически. Из таких случайностей произошли многие полезные изобретения.
Стоит обратить внимание, что автоматизированные подходы, включающие машинное обучение, могут быть подвержены социальным или культурным предубеждениям (т.е. отражать данные, на которых они изначально были обучены). Например, большие языковые модели часто обучаются на основе определённого массива информации (корпуса) и, таким образом, могут воспроизводить или даже усугублять существующие заблуждения или предубеждения, существующие в данной культуре. Это может привести к ошибочным выводам, если не учитывать этот фактор должным образом при поиске нужной информации на иностранном языке.
TwinkleTop.ru - Онлайн магазин запчастей © 2014 - 2025
ООО "TwinkleTop".
Данный информационный ресурс не является публичной офертой. Наличие и стоимость товаров уточняйте по телефону. Производители оставляют за собой право изменять технические характеристики и внешний вид товаров без предварительного уведомления.