Базовые сведения о статистике

Базовые сведения о статистике

Существуют различные определения того, что такое статистика или есть, причем некоторые авторы используют слово «статистика» для представления статистических результатов, в то время как другие используют его для описания процессов статистического анализа. Но, давайте обо всем по порядку.

Текст, который вы сейчас читаете, является средством передачи информации. Если на этой главе читается лекция, слова, которые вы слышите, произносятся таким образом, передавать информацию. Мы используем представления информации для передачи информация для других. Эти представления информации стали путать с самой информацией. Рассмотрим число 10. Вы только что прочитали «10»: два символа «1» и «0», которые, как вы предполагаете, написаны для представления числового значения 10. Но говорил ли автор о 10 к основанию 10 (1010), которое является числом 10, как это обычно бывает,  или автор имел ввиду ,что  10 относится к основанию 2 (10^2) который является двоичным числом, которое мы  обычно называют 2, потому что мы используем базу 10?

Абстракция все время используется в общении, чтобы передать только необходимую  информация, которая требуется. Если бы нужно было рассказать вам, как была создана эта глава, то было бы сказано, что создан файл Microsoft Word, текст был введен с помощью портативного компьютера. Этот является примером абстракции, потому что мы избежали описания биомеханических деталей каждого нажатия клавиши во время ввода главы. Мы естественно используем абстракцию все время в количественных исследованиях, а также,например, при исследовании требований к спорту или физические упражнения, мы бы свели всю сложность исследовательского опыта участника к использованию соответствующих переменных, таких как средняя частота сердечных сокращений, лактат крови, концентрация и самоотдача (RPE). Использование качественных данных также предполагает абстракцию с реальным поведением, мыслями, эмоциями, убеждениями и опытом, представленными словами. Некоторые исследования могут абстрагировать жизненный опыт от последовательности дискретных события, в то время как другие будут представлять опыт как более непрерывный процесс. При рассмотрении того, откуда в конечном итоге берутся данные исследований, возникают глубокие философские вопросы. о человеческом сознании: о том, как мы видим вещи и слышим вещи. Кто-нибудь еще видит синий цвет как автор? Мы можем согласиться, что объект синий, но это может быть не так, но мы думаем, что другие видят это так, как мы. Звуки, которые нам слышны, могут отличаться. Когда кто-то говорит слово «синий», мы все считаем, что все остальные слышит звук слова «синий», произнесенного так же, как и мы. Однако мы никогда по-настоящему не знаем, как другие ощущают и ощущают мир. Использование письменного и устного языка помогает нам общаться, поскольку у всех нас есть свои собственные способы интерпретации писем и звуковые волны, производимые речью.

Типы данных, переменные, значения и константы

Различают когнитивный, аффективный и психомоторный домены, показывая, что различные аспекты этих доменов измеряются с помощью тестов, которые предоставляют данные для передачи. Например, восприятие является аспектом аффективной области, который может быть представлен шкалой Лайкерта от 1 до 9. Существует огромное множество типы данных, которые можно использовать в исследованиях. Эти различные типы данных включают факты, знания, намерения, отношения, мотивы, первичные и вторичные данные и опубликованную статистику. Безотносительно источника данных, исследователь должен использовать абстрактное представление данных, чтобы сделать исследование управляемым.

Нужны структуры данных быть однозначно объявленным, чтобы одинаково однозначные алгоритмы могли быть записаны в заполнять структуры данных, а также извлекать и изменять данные из этих структур данных. Алгоритмы и структуры данных, разработанные программистами, должны быть однозначными и полными, потому что компьютеры не обладают человеческим интеллектом и действительно нуждаются в них быть сказано все до мелочей. Чтобы понять структуры данных, необходимо понимать типы данных, константы и переменные. В статистике эти же вещи должны быть рассмотрены  с учетом большого статистического анализа, выполняемого с помощью компьютеризированных пакетов, таких как SPSS (SPSS: компания IBM, Армонк, Нью-Йорк) и Minitab (Minitab Inc., штат Колледж, Пенсильвания).

Типы данных включают символьные строки, действительные числа, количественные числительные, целые числа и наборы именованных значения. Количественные числительные являются положительными целыми числами, включая 0 (0, 1, 2, 3, ...), целые числа являются положительными и отрицательными целыми числами, в то время как действительные числа включают бесконечное количество значений между каждой парой целых чисел. Нет необходимости углубляться в более сложные типы, используемые в языках программирования в этой книге. Достаточно сказать, что Существует много общего между разработкой структур данных для компьютеризированных систем и структуры данных для статистического анализа в исследованиях.

Для наших целей типами данных являются конкретные версии шкал измерения:

  • Номинальная шкала
  • Порядковая шкала
  • Интервальная шкала
  • Относительная шкала

Первые две шкалы являются категориальными шкалами измерения, поскольку переменные используют конечный набор именованные значения. Разница между номинальными переменными шкалы и порядковыми переменными шкалы является то, что значения номинальной переменной масштаба не имеют естественного порядка (например, мужской и женский), в то время как переменные порядкового масштаба используют значения, которые имеют определенный порядок (для 6 данные, информация и статистика например, «никогда», «редко», «иногда», «часто» и «всегда»). Это позволяет применять операции сравнения, такие как «меньше» ().

Переменные и интервальные шкалы представляют собой числовые переменные, используемые для измерения таких величин как расстояние, масса, сила, скорость, а также количество событий. Переменные шкалы характеризуется фиксированным интервалом между точками на шкале измерения. Например, четыре не просто больше трех, это ровно один больше трех. Этот измеряемый интервал означает, что не только сравнения, такие как больше и меньше, чем могут быть применены к переменные шкалы интервалов, но значения также могут быть вычтены. Пример интервальной шкалы переменная температура с использованием шкалы градусов Цельсия: 4˚C не просто больше, чем 1˚C, это точно на 3˚C больше, чем 1˚C.

Переменные масштабной шкалы включают все свойства переменных интервальной шкалы, но в дополнение переменные масштаба используют ноль для представления отсутствия измеряемой концепции. Это означает это так же как вычитание, разделение может быть сделано. Например, 6 м в два раза длиннее 3 м. Мы не можем сделать это с температурой, измеренной в градусах Цельсия: 4 ° C не в четыре раза теплее как 1˚C, потому что 0˚C не означает полного отсутствия тепла. Интервал и шкала соотношений переменные могут быть дискретными или непрерывными. Значения шкалы дискретных интервалов являются целочисленными тогда как значения шкалы дискретного отношения являются кардинальными числами. Например, если мы рассчитывали приседания выполняются за минуту, 40 приседаний - это на 20 приседаний больше, чем 20 приседаний и вдвое больше чем 20 приседаний. Просто потому, что переменная не измеряется в непрерывной числовой шкале не означает, что деление и вычитание не могут быть сделаны. Непрерывные числовые переменные используют действительные числа в отличие от количественных числительных и целых чисел.

Существуют разные типы номинальной шкалы; например, пол имеет два именованных значения

(женский и мужской), в то время как позиция в футбольной команде может иметь четыре значения (вратарь, защитник, полузащитник и нападающий). Пол звучит как переменная, но студенты, изучающие информатику, понимают, что лучше всего использовать ее как тип на случай, если нам понадобится несколько переменных этого типа. Например, пол участника и пол тренера участника может быть две отдельные переменные типа пола. Женщина и мужчина являются ценностями типа Пол. Многие учебники статистики не доходят до такого уровня детализации, как компьютерное программирование. тексты делают и обычно ссылаются на пол как переменную, а не тип, особенно если есть В данном исследовании использовалась только одна гендерная переменная. Текущий учебник не пойдет в уровень определения учебников по компьютерному программированию либо по двум основным причинам. Первый, во многих примерах может быть только одна гендерная переменная (например) и типы и переменные могут сбивать с толку. Во-вторых, пакеты статистического анализа обычно позволяют определять переменные с использованием стандартных типов или состоять из определенных пользователем значений без необходимости пользовательских типов.

Существуют также разные типы порядковых шкал; например, частота возникновения может   содержать пять упорядоченных значений («никогда», «редко», «иногда», «часто» и «всегда»), а уровень соглашения могут содержать пять различных значений («категорически не согласен», «не согласен», «не определен», «Согласен» и «полностью согласен»). Переменные интервала могут использовать поддиапазон набора действительных чисел; например, угловое смещение может варьироваться от -π до + π. То же самое относится и к соотношению маcштабирования данных, где процент будет варьироваться от 0,0 до 100,0.

Высота является переменной, в то время как постоянная 1,73 м является конкретным значением высоты, которое может быть нижний предел для вступления в полицейскую службу. Переменные, такие как рост, масса тела и масса тела данные, информация и статистика Индекс (BMI) позволяет определить общие отношения между переменными, которые сохраняются для бесконечного количества значений без указания отношения для каждой комбинации значений. Показана функциональная взаимосвязь, определяющая BMI с точки зрения роста и массы тела в уравнении 1.1.

BMI  = масса тела / (рост^2 )

Единицы измерения статистического анализа

Высота - это переменная, а 1,80 м - это значение, которое может быть присвоено этой переменной для конкретного случая. Иногда представлены как  «элементы», «переменные» и «наблюдения» при введении характера данных для анализа с использованием статистических методов. Элементы - это случаи или участники исследования. Переменные - это измеримые характеристики, такие как рост, масса тела и пол, как уже обсуждалось. Наблюдение – это набор значений, представляющих элемент: одно значение на характеристику. Например, исследование может включать переменные пол, рост и массу тела. У нас может быть определенный элемент (участник 1) в нашем исследовании, который представлен значениями "женщина", 1,75 м и 54,2 кг для пол, рост и масса тела соответственно.

Во многих случаях выбор единицы анализа исследования спортивных результатов. Например, исследование стратегии тенниса может использовать точку, матч (объединение двух игроков), игра игрока в матче или типичная игра игрока, основанная на данных нескольких матчей в качестве единицы анализа.

Независимые и зависимые переменные

Помимо классификации по типу, переменные также могут быть классифицированы в соответствии с их ролью в исследовании. Различают объяснение и ответ как переменные в экспериментальных исследованиях. Другие называют их как независимые и зависимые переменные соответственно, где номинальное или предполагается, что порядковые переменные оказывают влияние на некоторый зависимый интервал или отношение переменных масштаба, номинальные и порядковые переменные масштаба иногда называют факторами.

Факторы являются независимыми переменными с конечным числом значений или уровней. Например, пол измеряется на двух уровнях, потому что есть два значения пола (женский и мужской).

Социально-экономическая группа может быть измерена на шести уровнях (A, B, C1, C2, D и E). Некоторые факторы упоминаются как факторы между субъектами, потому что они используются для различения группы людей. Как гендерные, так и социально-экономические группы были бы между субъектами. Другие факторы - это факторы внутри субъекта, где их уровни (или значения) представляют разные времена или условия, при которых измеряются все участники. В исследовании вариаций мы могли бы использовать переменное время, которое измеряется на шести уровнях (04:00, 08:00, 12:00, 16:00, 20:00 и 00:00). Это внутренний фактор, потому что все участники исследования будут проверены все шесть раз.

Сomments

no