как оценить свой ум
Уровень IQ у человека – что это такое, как его измерить и можно ли повысить показатель
Какой у вас IQ? Пишите в комментариях
Уверена, что каждый из вас уже слышал термин IQ. Этот показатель оценивают в школах и крупных компаниях при трудоустройстве. Но не все ясно понимают, что такое IQ (ай-кью) у человека и как его измеряют, насколько точными можно считать результаты и как этот коэффициент влияет на успехи в жизни.
Сегодня попробуем разобраться в этих вопросах. Также у вас будет возможность самим пройти тест на IQ и лучше узнать себя.
Что такое IQ
С английского аббревиатура IQ расшифровывается как intelligence quotient – коэффициент интеллекта – и произносится как “ай-кью”.
IQ – это количественная оценка умственных способностей человека, которая определяется с помощью специально подготовленных тестов.
Показатель не является постоянной величиной. Он может меняться с возрастом: увеличиваться у тех, кто занимается саморазвитием, спортом, получает полезные навыки, и снижаться у тех, кто решил запустить свою жизнь.
Кроме того, уровень IQ может иметь определенную динамику в зависимости от самочувствия человека.
Многие неверно понимают, что значит коэффициент интеллекта, полагая, что он отражает степень эрудированности и образованности человека. Это не совсем так. IQ позволяет оценить мыслительный потенциал:
Коэффициент показывает не сам уровень интеллекта, а лишь его соответствие норме аналогичного уровня либо отклонение от нее. В этом случае за норму берется среднестатистический человек, т. е. индивидуум того же или среднего возраста.
Если говорить простыми словами, то коэффициент IQ можно сравнить с ростом человека. В среднем рост женщин в России составляет 166–168 см, а у мужчин – 178 см. Если мы смотрим на прохожего, то сразу можем оценить, насколько он высок, т. е. выше среднего его рост или ниже.
При этом средний рост также не является постоянной величиной. Он может изменяться с эволюцией, условиями жизни и прочими факторами. С показателем IQ примерно то же самое.
Кто придумал термин
В начале 20-го века во Франции ввели обязательное образование, из-за чего возникла необходимость отделить способных к обучению детей от тех, кто нуждался в определенной помощи и специальных школах.
По распоряжению правительства психолог Альфред Бине создал методику, которая позволила оценить интеллектуальные способности будущих учеников. Именно Бине считается тем, кто придумал термин IQ. Совместно со своим коллегой Теодором Симоном он начал проводить эксперименты, изучая память, мышление и внимание детей в возрасте от 3 до 12 лет.
Первая редакция оценочной шкалы была опубликована в 1905 году и получила название “Шкала Бине – Симона”.
Чуть позже немецкий психолог и философ Уильям Штерн предложил более точную формулу вычисления коэффициента интеллекта. Так в 1912 году впервые появился термин IQ.
Позже система вычисления неоднократно изменялась. В 1916 году шкала попала в США, где была раскритикована и доработана Стэнфордским университетом, после чего она обрела свое устойчивое название “Шкала Стэнфорд – Бине”. Последняя пятая редакция была опубликована уже в 2003 году.
Как измеряется
Для измерения уровня IQ существует множество различных тестов. Все они есть в открытом доступе в интернете. Чуть позже я дам ссылку на один из них.
Есть два варианта тестирования на интеллект:
Средняя продолжительность прохождения – 30 минут. Число вопросов и заданий может варьироваться от 30 до 100.
Как правило, тестирование состоит из двух частей:
Система подсчета везде одинаковая, но из-за определенных локальных различий результаты тестов могут отличаться на 10–15 пунктов.
От чего зависит
Психологи и ученые неоднократно проводили исследования, пытаясь найти взаимосвязь между тем, каким должен быть уровень интеллекта, и различными данными человека:
Некоторые исследователи даже связывали IQ с музыкальными пристрастиями. Так, по мнению британских ученых, коэффициент интеллекта выше у поклонников классической музыки и тяжелого рока. Самый низкий уровень IQ у людей, предпочитающих R’n’B и хип-хоп.
В действительности ни одно из исследований так и не дало оснований полагать, что тот или иной фактор оказывает существенное влияние на IQ человека. Любые различия, связанные с полом, расой или другими параметрами, можно объяснить погрешностями, эмоциональным и физическим состоянием человека во время проведения тестирования и даже временем суток.
В то же время принято считать, что у детей одаренных родителей больше шансов на высокие показатели интеллекта. Кроме того, чем более благополучна среда проживания ребенка, тем более высокий коэффициент интеллекта он сможет продемонстрировать в будущем.
На IQ влияет и возраст человека. Как правило, к 26 годам интеллект достигает своего пика, а затем постепенно начинает снижаться.
Тесты для определения уровня интеллекта
Есть множество различных тестов, определяющих уровень интеллекта человека. Самыми популярными являются программы Айзенка, Равена, Амтхауэра, Векслера.
Поскольку авторы не придерживаются единых стандартов в оценке результатов, итоговые значения могут отличаться.
Пройти тест на IQ можно совершенно бесплатно на сайте iq-tests.ru.
Более подробно о тестах на IQ вы можете прочитать на нашем блоге.
Не только IQ: 10 тестов на проверку интеллекта
Ниже мы перечислили различные варианты интеллектуальных тестов, которые вы можете пройти бесплатно. Название содержит ссылку на тест, далее идет его описание и информация о создателе.
Сайт, на котором расположен данный тест, позволяет пройти 862 опроса по разным тематикам: личность и характер, темперамент, бизнес и работа. Тесты доступны бесплатно и с любого устройства. Автором данного теста на интеллект является Рэймонд Ричард Кеттел, британский и американский психолог, который внес значительный вклад в развитие дифференциальной психологии. Опросник изначально состоял из 187 вопросов. На сайте представлена краткая версия, которая состоит из 8 крайне необычных зданий. После прохождения данного теста можно перейти к его развернутой версии по ссылке
Одним из наиболее интересных опросов является тест на социальный интеллект Джоя Пола Гилфорда, создателя многофакторной модели структуры интеллекта, так называемой «кубической модели». Данный тест даст возможность определить коммуникативные навыки и способность прогнозировать поведение людей, а также адаптивность. В самом тесте есть два типа вопросов — вербальные и невербальные. Большая часть теста состоит из выбора картинок, которые отражают ту или иную социальную ситуацию. Всего в тесте 55 вопросов и некоторые из них могут вызвать значительные затруднения, поэтому рекомендуем заложить на него достаточное количество времени.
Сайт по ссылке посвящен исключительно тесту интеллекта Векслера и интерпретации его результатов. Знаменитый психолог и психиатр Дэвид Векслер считал, что помимо стандартного понимания интеллекта существует множество факторов, определяющих разумность человека. Его тест считается одним из самых известных и используемых и в свое время стал настоящим прорывом после стандартных IQ-тестов. Каждые десять лет он обновляется для актуальности и избежания повышения результатов, которое известно как эффект Флинна. Как и в случае с тестом на социальный интеллект, он разделен на две части — вербальную и невербальную.
Тест прогрессивных матриц Равена
Тест прогрессивных матриц Равена (Рейвена) измеряет интеллект и логичность мышления, показывает способность к научению, обработке информации. Английский психолог Джон Карлайл Равен хотел создать тест, доступный для большинства и с быстрым сбором результатов. Изначально он разрабатывал два теста на интеллект — «прогрессивные матрицы» и «словарный тест Mill Hill». В 1938 году он опубликовал тест с матрицами, который потом дорабатывал. В этом тесте не надо читать вопросы или решать математические задачи. Вы просто изучаете рисунки (матрицы), в которых недостает определенного фрагмента. Правильный фрагмент вам и предстоит выбрать. Задания располагаются по степени сложности, от самого простого, как на картинке, до неочевидных вариантов. Тест имеет высокую степень надежности и достоверности результатов.
Тест предназначен для оценки интеллекта людей от 13 до 61 лет. Создан немецким психологом Р. Амтхауэром в 1953 году. Амтхауэр изучал структуру интеллекта, тему, которой ранее не уделяли много внимания. Интеллект в этом тесте рассматривается как набор психических способностей. Поэтому он состоит из нескольких частей и посвящен разным аспектам: исследованию индуктивного мышления — умению делать выводы от частного к общему, исследованию способности к абстрагированию, анализу комбинаторных способностей — умению искать и преобразовывать одни элементы в другие, создавая комбинации, оценке способности к счету, оценке пространственного воображения и умению концентрироваться. Результаты теста могут использоваться для профориентации.
Тест на определение общих умственных способностей. Разработан В. Н. Бузиным в конце 80-х годов и представляет переработанный вариант «Кадрового теста Вандерлика» (Wonderlic Personnel Test). Тест анализирует способность анализа и обобщения контента, адаптивность мышления, возможность переключения, скорость восприятия информации и способность к концентрации. В тесте установлен лимит времени. КОТ может быть использован для отбора и распределения кадров, понимания их обучаемости.
Тест механической понятливости Беннета (ТМПБ) оценивает уровень технических знаний человека, физических принципов. Его применяют в школах, университетах, при приеме на работу в качестве ассессмента. Первоначально тест состоял из 68 вопросов, на которые нужно было ответить за 30 минут. Сейчас для тестирования применяются адаптированные версии с меньшим количеством вопросов. Прямую связь между механической «понятливостью» и качеством работы сотрудников в 1993 году выявил Поль Мучински. Сейчас при помощи данного теста определяют пространственное мышление и понимание того, как устроен окружающий мир, и самое главное — способность человека к обучению.
Вы наверняка знакомы с этими тестами, если стажировались или пытались устроиться в одну из крупных компаний. SHL-тестами в разное время пользовались такие крупные и известные организации, как Сбербанк, Toyota, IKEA. Чаще всего его проводят транснациональные компании, чтобы выявить математические и логические способности кандидата. Существует несколько типов SHL-тестов: вербальные, логические и числовые. Пример числового теста представлен на картинке.
IQ тест Айзенка
Немецко-британский учёный-психолог Ганс Айзенк имел противоречивые взгляды на разум человека. Например, он считал, что существуют различия между представителями различных рас с точки зрения психики и интеллекта. Однако его IQ-тесты завоевали всеобщее признание и стали широко использоваться для комплексной оценки умственного развития в школах, университетах и других организациях. IQ-тест Ганса Айзенка имеет множество вариаций. Обычно за ограниченное количество времени вам нужно решить 40 задач, их сложность возрастает к концу теста.
Тест на типы интеллекта Говарда Гарднера
Как оценивать интеллект? Подход Google
В ноябре 2019 года вышла программная статья от Google «Об оценке интеллекта» Франсуа Шолле (создатель Keras).
64 страницы посвящены тому, как появилось современное понимание ИИ, почему машинное обучение от него так далеко, и почему мы все еще не можем адекватно измерить «интеллект».
Чтобы отбор был честным, задание для всех одно: залезьте на дерево
Наша команда занимается NLP и общей методологией ИИ-тестов, учитывая последние тренды в универсальных трансформерах типа BERT, которые оцениваются тестами на логику и здравый смысл. Так, NLP забирает в себя все новые задачи, связанные с воспроизведением все более сложных действий и по сути отражающих механизмы мышления. Оказалось, что и другие области ML отхватили свой кусок пирога в этом направлении. Например, CV — «Animal AI Challenge».
Понятно, что сейчас “лучше” при возможности делать ML-модели более интерпретируемыми, не использовать 10 маленьких классификаторов, а тренировать одну модель, и так далее, но насколько это все-таки далеко от реального “интеллекта”?
Программная статья дает подробный и разгромный разбор исследований в сфере технической оценки современного ИИ.
В конце статьи автор предлагает свой собственный тест и датасет к нему: Abstraction and Reasoning Corpus (ARC), привязанный к абстрактному мышлению.
Но обо всем подробнее.
Конспект “On the Measure of Intelligence“
Чтобы сознательно создавать более интеллектуальные и более похожие на человека искусственные системы, нам требуется ясное определение интеллекта и умение оценивать его. Это нужно, чтобы корректно сравнивать две системы, или систему с человеком. За последнее столетие предпринималось много попыток определить и измерить интеллект как в области психологии, так и в области ИИ.
Современное ML-сообщество по-прежнему любит сравнивать умения, которые демонстрируют ИИ и люди – при игре в настольные и компьютерные игры, при решении задач. Но для оценки интеллекта мало измерить только умение решать поставленную задачу. Почему? Потому что это умение во многом формируется не интеллектом, а прежними знаниями и опытом. А их можно «купить». Скармливая системе неограниченный объём обучающих данных или предварительной информации, экспериментаторы могут не только вывести машину на произвольный уровень навыков, но и скрыть то, насколько способна к интеллектуальному обобщению сама система.
В статье предлагается 1) новое официальное определение интеллекта на основе эффективности приобретения навыков; 2) новый тест на способность формирования абстракций и логических выводов (Abstraction and Reasoning Corpus, ARC). ARC можно использовать для измерения человеческой формы сильного подвижного интеллекта, это позволяет численно сравнивать относительно сильный интеллект систем ИИ и человека.
Необходимо практически полезное определение интеллекта и его метрик
Цель развития ИИ – в создании машин с интеллектом, который сопоставим с интеллектом людей. (Так цель была сформулирована с момента зарождения искусственного интеллекта в начале 50-х годов ХХ века, и с тех пор эта формулировка сохраняется).
Но пока мы можем создавать системы, которые хорошо справляются с конкретными задачами. Эти системы несовершенны: они хрупки, требуют всё больше и больше данных, неспособны разобраться в примерах, слегка отклоняющихся от обучающей выборки, а также не могут перенастраиваться на решение новых задач без помощи людей.
Причина этого в том, что мы до сих пор не можем однозначно ответить на вопрос о том, что такое интеллект. Существующие тесты, например, тест Тьюринга [11] и премия Лёбнера [10], не могут служить драйверами прогресса, поскольку полностью исключают возможность объективно определить и измерить интеллект, а опираются на субъективную оценку.
Наша цель – указать на неявные предубеждения в отрасли, а также предложить имеющее практическую ценность формальное определение и критерии оценки сильного интеллекта, подобного интеллекту человека.
Определение интеллекта: два противоречивых подхода
Суммарное базовое определение ИИ звучит так: «Интеллект измеряет способность агента достигать целей в широком диапазоне сред». Ничего не объясняет?
Весь конфликт в современной науке сводится к тому, что считать отправной точкой естественного интеллекта:
Оценка ИИ: от оценки умений к оценке широких способностей
Тесты на заданных наборах данных стали главным драйвером прогресса в области ИИ, поскольку они воспроизводимы (тестовый набор фиксирован), справедливы (тестовый набор одинаков для всех), масштабируемы (многократное повторение теста не ведет к высоким расходам). Многие популярные тесты — DARPA Grand Challenge [3], Netflix Prize — внесли вклад в развитие новых алгоритмов ML-моделей.
При положительных результатах, даже добытых кратчайшим путем (с оверфиттингом и костылями), ожидаемый уровень качества постоянно поднимается. МакКордак назвала это «эффектом ИИ»: «Каждый раз, когда кто-то придумывал новый способ заставить компьютер делать нечто новое (играть в шашки) – обязательно появлялись критики, которые говорили: “Это не мышление”» [7]. Когда мы знаем, как именно машина делает что-то «умное», мы перестаем считать это умным.
«Эффект ИИ» появляется потому, что путаются процесс использования интеллекта (например, процесс обучения нейросети игре в шахматы) и артефакт, создаваемый таким процессом (получившаяся модель). Причина путаницы проста – в человеке эти две вещи неразделимы.
Для отхода от оценки лишь артефактов, а само способности к обучению и приобретению новых навыков вводят понятие “диапазона обобщения”, при котором система принимает градуальные значения.
В настоящее время мы выходимся на новом этапе, в котором стремимся создавать гибкие системы — возрастает интерес к использованию широкого набора тестовых заданий для оценки систем, развивающих гибкость:
Новая концепция
Как сравнивать искусственный интеллект с человеческим, если уровень различных познавательных способностей у разных людей неодинаков?
Результаты тестов на интеллект у людей с разными способностями могут совпадать – это общеизвестный факт когнитивной психологии. Он показывает, что познание – это многомерный объект, структурированный иерархически по образу пирамиды с широкими и узкими навыками, наверху которой находится фактор общего интеллекта. Но действительно ли «сильный интеллект» – это вершина когнитивной пирамиды?
Теорема «бесплатных обедов не бывает» [14, 15] говорит нам о том, что любые два алгоритма оптимизации (включая человеческий интеллект) эквивалентны, когда их производительность усредняется для каждой возможной задачи. То есть для того, чтобы добиться производительности выше случайной, алгоритмы должны быть заточены под свою целевую задачу. Однако в данном контексте под «любой возможной задачей» подразумевается равномерное распределение по предметной области. Распределение задач, которые были бы актуальны именно для нашей Вселенной, не соответствовало бы такому определению. Таким образом, мы можем задать следующий вопрос: является ли фактор интеллекта человека универсальным?
В действительности люди пока собрали слишком мало информации о когнитивных способностях окружающих их агентов — других людей (в разных культурах “умность” оценивается по-разному) и животных, например, осьминогов или китов.
Судя по всему, человеческий интеллект далеко не универсален: он непригоден для большого ряда задач, под которые не адаптированы наши врожденные априорные знания.
Например, люди могут очень эффективно решать некоторые небольшие задачи полиномиальной сложности, если те мыслительно пересекаются с эволюционно знакомыми задачами вроде навигации. Так, задача коммивояжера с небольшим количеством точек может быть решена человеком почти оптимально за почти линейное оптимальное время [6], с использованием стратегии восприятия. Однако, если вместо «нахождения кратчайшего пути» попросить его найти самый длинный путь [5], то человек справится сильно хуже, чем один из простейших эвристических алгоритмов: алгоритм «дальнего соседа».
Авторы утверждают, что человеческое познание развивается по той же схеме, что и физические способности человека: и то, и другое развивалось в процессе эволюции для решения конкретных задач в конкретных средах (эти задачи известны как «четыре F» — четыре основных инстинкта: fighting, fleeing, feeding and fornicating: бей, беги, кормись и размножайся).
Основной посыл этой работы заключается в том, что «сильный интеллект» – это свойство системы, которое нельзя определить бинарно: «либо оно есть, либо нет». Нет, это диапазон, зависящий от:
Чего ожидать от идеального теста ИИ?
Предлагаемый тест: массив данных ARC
ARC можно рассматривать как эталонный тест сильного искусственного интеллекта, как эталонный тест программного синтеза или как психометрический тест интеллекта. Он нацелен как на людей, так и на системы искусственного интеллекта, предназначенные для имитации сильного подвижного интеллекта, сходного с интеллектом человека. По формату он чем-то напоминает прогрессивные матрицы Равена [4], классический тест на IQ, восходящий к 1930-м годам.
В состав ARC входят два набора данных: обучающий и оценочный. В обучающем наборе 400, а в оценочном — 600 задач.
При этом оценочный набор также делится на два: открытый (400 задач) и закрытый (200 задач). Все предложенные задачи уникальны, и набор оценочных задач не пересекается с набором обучающих.
Каждая задача состоит из небольшого количества демонстрационных и тестовых примеров. Демонстрационных в среднем 3,3 на задачу, тестовых – от одного до трех, чаще всего один. Каждый пример, в свою очередь, состоит из input grid и output grid.
Такая «сетка» – это матрица из определенных символов (каждый из которых, как правило, выделяется определенным цветом):
Всего уникальных символов (или цветов) — 10. «Сетка» может быть любой высоты или ширины – от 1×1 до 30×30 включительно (средняя высота — 9, средняя ширина — 10).
При решении оценочной задачи участник тестирования получает доступ к обучающим примерам (как к «входной», так и к «выходной сетке»), а также к начальным условиям для выполнения тестового задания – «входной сетке» соответствующих тестовых (оценочных) примеров. Далее участник тестирования должен построить собственную «выходную сетку» для «входной сетки» каждого тестового примера.
Построение «выходной сетки» осуществляется исключительно с нуля, то есть участник тестирования должен сам решить, какова должна быть высота и ширина этой «сетки», какие символы следует в нее поместить и куда. Считается, что задача решена успешно, если участник тестирования может дать точный и правильный ответ по всем входящим в нее тестовым примерам (двухчастный показатель успеха).
Наличие закрытого оценочного набора позволяет нам строго следить за чистотой оценки в условиях открытого конкурса. Примеры заданий ARC:
Задача, неявная цель которой заключается в том, чтобы закончить симметричную схему. Характер этой задачи определяется тремя входными/выходными примерами. Участник тестирования должен составить выходную сетку, соответствующую входной (см. внизу справа).
Задача по устранению «шумов».
Красный объект «перемещается» по направлению к голубому, пока не входит с ним в «контакт».
Задача, неявная цель которой заключается в том, чтобы продолжить (экстраполировать) диагональную линию, которая «отскакивает» при контакте с красным препятствием.
Задача, где необходимо выполнить разом целый ряд действий: «продолжить линию», «обойти препятствия» и «эффективно достичь конечной цели» (в реальной задаче приводится больше демонстрационных пар).
ARC не предоставляется как идеальный и законченный тест, тем не менее, он обладает важными свойствами:
Как вы думаете — может, основная идея будет более успешна, если удастся отвлечь внимание сообщества сильнго ИИ от попыток превзойти людей в конкретных задачах?