Какой рейтинг вас больше интересует?
|
Главная /
Каталог блоговCтраница блогера Бриз_Сергей/Записи в блоге |
Бриз_Сергей
Голосов: 1 Адрес блога: http://www.liveinternet.ru/users/1073032/ Добавлен: 2008-06-02 21:30:31 |
|
Есть еще одно занятие - Экзамен по эконометрике сдавать...
2011-10-30 21:54:54 (читать в оригинале)Чтоб пусто было тому человеку кто в совершенстве знает эконометрику.... А если её ведет Трусов, то я уверен, что мало кто её знает впринципе =))) Этот пост чисто для меня, ибо сижу как дурак, готовлюсь к экзамену, к предмету которого не знаю... сколько раз я готовился и сдавал подобные сессии... но такой ещё не было. То что иде после черты не обязательно есть в вопросах по ТРУСОВУ Александру Сергеевичу, не если и этого не знать, или хотябы не прочесть то хана.
________________________________________________________________________________________________________________
________________________________________________________________________________________________________________
1 Эконометрика — наука, изучающая количественные и качественные экономические взаимосвязи с помощью математических и статистических методов и моделей[1]. Современное определение предмета эконометрики было выработано в уставе Эконометрического общества, которое главными целями назвало использование статистики и математики для развития экономической теории[2]. Теоретическая эконометрика рассматривает статистические свойства оценок и испытаний, в то время как прикладная эконометрика занимается применением эконометрических методов для оценки экономических теорий. CASE – это-технология и инструментальные средства автоматизированного проектирования систем Data Mining-ориентированы на проверку не сформулированных гипотез Аддитивный факт-Можно суммировать по всем измерениям Алгоритм конструирования дерева решений-не требует от пользователя выбора входных атрибутов Ассоциация -поиск закономерности между связанными событиями в наборе данных Бинарной классификации-зависимая переменная может принимать только два значения В аналитической системе "Бюджет Аналитик" чем является "Классификатор доходов бюджета"?-Измерение В аналитической системе "Бюджет Аналитик" чем является "Поступления"?-Показатель В какой модели жизненного цикла реализуемость технических решений *проверяется путем создания прототипов-RAD В каком ответе говорится о частичном обобщении данных в хранилище?-Информация о доходах бюджета хранится по месяцам В многомерных гиперкубах-осями куба являются измерения В нотации IDEF0 стрелка, подходящая к левой грани функционального блока, относится к типу-Вход В системе "бюджет-аналитик" нужно выбрать 3 налоговых инспекции, через которые получены максимальные поступления доходов. Какой инструмент выбора данных использовать?-Выбор лучших/худших В системе "бюджет-аналитик" нужно выбрать дни заданного месяца. Какое измерение нужно зафиксировать перед входом в инструменты выбора данных?-Время В системе "бюджет-аналитик" нужно выбрать дни заданного месяца. Какой инструмент выбора данных использовать?-Список В системе "бюджет-аналитик" нужно выбрать налоги, поступления по которым лежат в заданных пределах. Каойк инструмент выбора данных использовать?-Выбор по исключению В системе "бюджет-аналитик" нужно выбрать налоги. Какое измерение нужно зафиксировать перед входом в инструменты выбора данных?-Классификатор доходов В системе "бюджет-аналитик" нужно найти корреспондента по известному имени. Какой инструмент выбора данных-использовать?-Поиск по совпадению В состав инвариантных компонент интегрированных ИС входят-WORKFLOW, GROUPWARE, DocFLOW, Виртуальное предприятие, CALS-технология В чем отличие добычи данных от традиционных средств анализа?-Наличие зависимостей априори неизвестно Для порядковой шкалы не применима операция-сложение Для чего нужна таблица покрытий?-Для задания отсутствующих фактов Если стрелка на диаграмме имеет тоннель с круглыми скобками, то-Разрешен Жизненный цикл отражает различные состояния системы-Начинается с момента принятия решения о необходимости его создания и заканчивается в момент его полного изъятия из эксплуатации. Зависит ли набор измерений многомерного куба от информации в связанной с ним транзакционной системе?-Да Иерархическая кластеризация использует-агломеративные методы и дивизимные методы Иерархия измерения-определяет направление агрегирования показателей Измерение "Классификатор расходов" содержит несколько иерархий?-Да Итеративные методы кластеризации-Используются при большом количестве наблюдений К какому виду программного обеспечения относятся СУБД? -Прикладное общего назначения Как называются статьи расходов в AllFusion Process?-Центры затрат Какая группа процессов не определена международным стандартом ISO/IEC 12207?-управляющие процессы Какая команда контекстного меню в MS Excel используется для агрегирования данных?-Скрыть детали Какая команда контекстного меню в MS Excel используется для дезагрегирования данных?-Отобразить детали Какая методология лежит в основе IDEF0?-SADT Какая модель не является моделью жизненного цикла?-структурная Какая характеристика относится к каскадной модели ЖЦ?-Переход с одного этапа на следующий происходит только после того, как будет полностью завершена работа на текущем Какая характеристика относится к спиральной модели ЖЦ?-Каждый виток спирали соответствует созданию фрагмента или версии ПО Какие значения правильны для листа бинарного дерева классификации?-пасмурно, солнечно Какие инструменты выбора данных в системе "бюджет-аналитик" нельзя использовать для выбора показателей?-Сортировка Какие параметры используются для расчета стоимости выполнения работы?-Частота, продолжительность, стоимость работы Какие понятия относятся к модели данных хранилища?-Измерения, факты, иерархия Какие стрелки НЕ могут присутствовать на DFD-диаграмме?-Механизм Какие характеристики не относятся к хранилищу данных?-Предназначен для обработки транзакций Каким образом определяются стоимостные затраты на выполнение контекстной работы?-Сумма затрат всех декомпозированных работ Какое из определений не относится к типам шкал?-символьная Какое из перечисленных видов обеспечения ИС соответственно ГОСТ 34.602-89 отсутствует:-Сопровождение Какое из утверждений правильно?-Большие коррекции весов могут привести к постоянной неустойчивости процесса обучения. Какое из утверждений правильно?-Чем меньше приращение весов, тем меньше скорость обучения нейронной сети Какое определение для хранилища данных правильно?-Предметно-ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений Какое утверждение верно?-Переменная изначально не является зависимой или независимой. Какой графический элемент отсутствует в нотации IDEF3?-Хранилище Какой из перечисленных графических элементов не входит в диаграмму IDEF0?-Хранилище Какой инструмент MS Excel используется для анализа многомерных данных?-Сводная таблица Какой международный стандарт определяет структуру жизненного цикла ИС?-ISO/IEC 12207 Какой пример относится к выявляемой закономерности типа кластеризация?-Выделяются однородные заранее неизвестные группы покупателей Какой список включает только измерения системы "бюджет-аналитик"-Время, ИМНС, Классификатор доходов, Счета бюджета Какой список определяет технологии аналитической обработки информации?-OLAP, Data Mining, Хранилище данных Какой тип стрелки отсутствует среди перечисленных ниже стрелок IDEF0-диаграммы: вход, вызов, управление, механизм,?-Выход Классификация-Обнаруживаются условия (признаки), которые характеризуют группы объектов Кластеризация-Разбиение объектов на группы Менеджер хранилища выполняет операции-Анализ непротиворечивости и очистка данных Методология моделирования, использующая только два графических элемента: функциональный блок и стрелку, называется-IDEF0 Методология моделирования, использующая четыре графических элемента: функциональный блок, стрелку, хранилище данных и внешние сущности, называется-DFD Мигрируют ли граничные стрелки при декомпозиции IDEF0 в DFD?-Нет Мигрируют ли граничные стрелки при декомпозиции IDEF0 в IDEF3?-Нет Можно ли для нормирования переменных в кластерном анализе использовать экспертные оценки?-Да На входе перекрестка Асинхронное "Или" одна стрелка. Сколько стрелок должно быть на выходе-Больше одной На входе перекрестка Исключающее "ИЛИ" два процесса . Для такого перекрестка справедливо утверждение:-Только один предшествующий процесс завершен На входе перекрестка Синхронное "И" два процесса . Для такого перекрестка справедливо утверждение-Все предшествующие процессы завершены одновременно На входе перекрестка Синхронное "Или" две стрелки. Сколько стрелок должно быть на выходе-Одна На выходе перекрестка Асинхронное "И" три процесса. Для такого перекрестка справедливо утверждение:-Все следующие процессы должны быть запущены На выходе перекрестка Асинхронное "Или" три процесса. Для такого перекрестка справедливо утверждение-Один или несколько следующих процессов должны быть запущены На выходе перекрестка Исключающее "ИЛИ" три процесса. Для такого перекрестка справедливо утверждение:-Только один следующий процесс запускается На каких этапах ЖЦ проводится моделирование бизнес-процессов?-Начало и проектирование На какой диаграмме должны размещаться цель и точка зрения модели?-Контекстная На основе созданных измерений можно построить-несколько разных кубов Нейронная сеть может иметь-много входов и выходов Область применения нейронных сетей:-процессы, характеризующиеся набором параметров, связанных неизвестной функциональной зависимостью. Обобщение-способность нейронной сети делать точный прогноз на данных, не принадлежащих исходному обучающему множеству Одномерная классификация-по одному признаку Оперативная аналитическая обработка относится к-неглубокому уровню получаемых знаний Относительная шкала...-является числовой Перед "сливающим" перекрестком "Синхронный ИЛИ" функции заканчиваются-В любой комбинации Одновременно Перечисленные задачи относятся к Data Mining-Кластеризация, Классификация, Прогнозирование, Анализ связей Персептрон -один слой искусственных нейронов, соединенных с помощью весовых коэффициентов с множеством входов. Полуаддитивный факт-можно суммировать вдоль определённых измерений После разветвляющего перекрестка "Синхронный И" функции начинаются-Все одновременно Почему в автоматизированных системах операционной обработки информации трудно проводить анализ?-Для создания аналитического запроса необходимо знать структуру таблиц и связей БД При выборе нескольких худших корреспондентов по показателю "Поступления доходов бюджета" что нужно сделать, чтобыне выводились неплательщики?-Поставить флажок исключить 0 При кластеризации классы объектов-изначально не предопределены. При кластеризации-могут быть спорные объекты Проблема владение данными для хранилищ данных-Интегрируются данные, принадлежащие разным владельцам Проблема недооценки ресурсов, необходимых для загрузки данных.-Источники данных в разных БД Разрешает ли нотация IDEF3 проводить слияние и разветвление стрелок без перекрестков?-Нет Решения задач Data Mining-имеют два основных этапа Синапсы нейронной сети-умножают входной сигнал на число, характеризующее силу связи Система для расчета зарплаты в организации относится к-Специализированная, офисная, проблемно-ориентированная Сколько FEO-диаграмм можно создать?-Любое количество Сколько иерархий может быть в измерении?-несколько Сколько типов перекрестков используется в нотации IDEF3-5 Скрытые проблемы источников данных для хранилищ данных-Поля данных системы операционной обработки не заполняются Следующие данные относятся к дихотомической шкале-мужчина, женщина Снимок данных-не обеспечивает хранения истории изменений Событийная модель-подходит для моделирования транзакций Стрелка на диаграмме IDEF0, изображающая связь между работами, может выходить из-Выход Сумматор нейронной сети-вычисляет скалярное произведение вектора входных сигналов и вектора весовых коэффициентов Тестовое множество-содержит входные и выходные значения примеров. Управление конфигурацией ИС по стандарту ISO/IEC 12207 относится к группе-Вспомогательных процессов Управление созданием ИС по стандарту ISO/IEC 12207 относится к группе-Основных процессов Функция активации-может принимать значения в заданном диапазоне Чем больше количество входов-тем больше должно быть обучающих фактов Что значит привязка ко времени данных в хранилищах?-Данные индексируются по временным периодам Что означает интегрированность хранилища данных?-Данные поступают из разных источников Что определяет размерность многомерного куба?-Измерения Что определяется в процессе обучения нейронной сети?-значений весовых (синаптических) коэффициентов Что такое FEO-диаграмма в BPWin?-Диаграмма используемая для иллюстрации других точек зрения или для отображения отдельных деталей Что такое реинжиниринг бизнес-процессов?-Реорганизация Что такое сценарий в BPWin?-Последовательности обработки заказа или события, которые необходимо обработать за конечное время Что хранится в ячейках куба?-Показатели Что является центром схемы звезда?-Таблица фактов Элемент Перекресток применяется для создания диаграмм в нотации-IDEF3 Элемент Работа применяется для создания диаграмм в нотации-IDEF3
Эконометрический метод складывался в преодолении следующих неприятностей, искажающих результаты применения классических статистических методов:
• асимметричности связей;
• мультиколлинеарности объясняющих переменных;
• закрытости механизма связи между переменными в изолированной регрессии;
• эффекта гетероскедастичности, т. е. отсутствия нормального распределения остатков для регрессионной функции;
• автокорреляции;
• ложной корреляции;
• наличия лагов.
Эконометрическая модель, как правило, основана на теоретическом предположении о круге взаимосвязанных переменных и характере связи между ними. При всем стремлении к «наилучшему» описанию связей приоритет отдается качественному анализу. Поэтому в качестве этапов эконометрического исследования можно указать:
• постановку проблемы;
• получение данных, анализ их качества;
• спецификацию модели;
• оценку параметров;
• интерпретацию результатов.
3. Линейное уравнение регрессии, коэффициенты модели.
Линейная модель парной регрессии есть: у=а0+а1х+
а1 - коэф-т регрессии, показывающий, как изменится у при изменении х на единицу
а0 - это свободный член, расчетная величина, содержания нет.
- это остаточная компонента, т.е. случайная величина, независимая, нормально распределенная, мат ожид = 0 и постоянной дисперсией.
В матричной форме модель имеет вид:
Y=XA+ε
Где Y– вектор-столбец размерности (nx1) наблюдаемых значений зависимой переменной; Х– матрица размерности (nx2) наблюдаемых значений факторных признаков. Дополнительный фактор х0 вводится для вычисления свободного члена; А– вектор-столбец размерности (2х1) неизвестных, подлежащих оценке коэффициентов регрессии; ε– вектор-столбец размерности (nх1) ошибок наблюдений
;
Параметры модели находятся с использованием МНК. Подсчитывается сумма квадратов ошибок наблюдений.
4 ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ
Линейная регрессия сводится к нахождению уравнения вида или .
Уравнение вида позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.
Построение линейной регрессии сводится к оценке ее пара¬метров а и в.
Оценки параметров линейной регрессии могут быть найдены разными методами.
1.
2.
Параметр b называется коэффициентом регрессии. Его вели¬чина показывает среднее изменение результата с изменением фактора на одну единицу.
Формально а — значение у при х = 0. Если признак-фактор
не имеет и не может иметь нулевого значения, то вышеуказанная
трактовка свободного члена, а не имеет смысла. Параметр, а может
не иметь экономического содержания. Попытки экономически
интерпретировать параметр, а могут привести к абсурду, особенно при а < 0.
Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора.
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют разные модификации формулы линейного коэф¬фициента корреляции.
Линейный коэффициент корреляции находится и границах: -1≤.rxy ≤ 1. При этом чем ближе r к 0 тем слабее корреляция и наоборот чем ближе r к 1 или -1, тем сильнее корреляция, т.е. зависимость х и у близка к линейной. Если r в точности =1или -1 все точки лежат на одной прямой. Если коэф. регрессии b>0 то 0 ≤.rxy ≤ 1 и наоборот при b<0 -1≤.rxy ≤0. Коэф. корреляции отражает степени линейной зависимости м/у величинами при наличии ярко выраженной зависимости др. вида.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детермина¬ции характеризует долю дисперсии результативного признака y, объясняемую регрессией. Соответствующая величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.
5. ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ.
Оценка значимости уравнения регрессии в целом дается с по¬мощью F-критерия Фишера. При этом выдвигается нулевая ги¬потеза, что коэффициент регрессии равен нулю, т. е. b = 0, и следовательно, фактор х не оказывает влияния на результат у.
Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложе¬ние общей суммы квадратов отклонений переменной у от средне го значения у на две части - «объясненную» и «необъясненную»:
- общая сумма квадратов отклонений
- сумма квадратов отклонения объясненная регрессией - остаточная сумма квадратов отклонения.
Любая сумма квадратов отклонений связана с числом степе¬ней свободы, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности nис числом определяемых по ней констант. Применительно к исследуемой проблеме число cтепеней свободы должно показать, сколько независимых откло¬нений из п возможных требуется для образования данной суммы квадратов.
Дисперсия на одну степень свободы D.
F-отношения (F-критерий):
Ecли нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором раз¬работаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным, если о больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт > Fтабл Н0 отклоняется.
Если же величина окажется меньше табличной Fфакт ‹, Fтабл , то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Но не отклоняется.
Стандартная ошибка коэффициента регрессии
Для оценки существенности коэффициента регрессии его ве¬личина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдентa: которое
затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы (n- 2).
Стандартная ошибка параметра а:
Значимость линейного коэффициента корреляции проверя¬ется на основе величины ошибки коэффициента корреляции тr:
Общая дисперсия признака х:
Коэф. регрессии Его величина показывает ср. изменение результата с изменением фактора на 1 ед.
Ошибка аппроксимации:
6,5. ИНТЕРВАЛЫ ПРОГНОЗА ПО ЛИНЕЙНОМУ УРАВНЕНИЮ РЕГРЕССИИ
Оценка стат. значимости параметров регрессии проводится с помощью t – статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигается гипотеза Н0 о статистически значимом отличие показателей от 0 a = b = r = 0. Рассчитываются стандартные ошибки параметров a,b, r и фактич. знач. t – критерия Стьюдента.
Определяется стат. значимость параметров.
ta ›Tтабл - a стат. значим
tb ›Tтабл - b стат. значим
Находятся границы доверительных интервалов.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что параметры a и b находясь в указанных границах не принимают нулевых значений, т.е. не явл.. стат. незначимыми и существенно отличается от 0.
7. НЕЛИНЕЙНАЯ РЕГРЕССИЯ. ВИДЫ МОДЕЛЕЙ
Если между экономическими явлениями существуют нели¬нейные соотношения, то они выражаются с помощью соответ¬ствующих нелинейных функций: например, равносторонней ги¬перболы , параболы второй степени и д.р.
Различают два класса нелинейных регрессий:
• регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым па¬раметрам;
• регрессии, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии по включаемым в нее объ¬ясняющим переменным могут служить следующие функции:
• полиномы разных степеней
• равносторонняя гипербола
К нелинейным регрессиям по оцениваемым параметрам от¬носятся функции:
• степенная
• показательная
экспоненциальная
8,9 ПРИМЕНЕНИЕ МНК К МОДЕЛЯМ НЕЛИНЕЙНЫМ ОТНОСИТЕЛЬНО ВКЛЮЧАЕМЫХ ПЕРЕМЕННЫХ И ОЦЕНИВАЕМЫХ ПАРАМЕТРОВ.
Нелинейная регрессия по включенным переменным не таит каких-либо сложностей в оценке ее параметров. Она определяет¬ся, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в парабо¬ле второй степени y=a0+a1x+a2x2+ε заменяя переменные x=x1,x2=x2, получим двухфакторное урав¬нение линейной регрессии: у=а0+а1х1+а2х2+ ε
Парабола второй степени целесообразна к применению, если для определенного интервала значений фактора меняется харак¬тер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. В этом случае определяется значение фактора, при котором достигается максимальное (или минимальное), значение результативного признака: приравнива¬ем к нулю первую производную параболы второй степени: , т.е. b+2cx=0 и x=-b/2c
Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:
Решение ее возможно методом определителей:
В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразо¬ванным уравнениям. Если в линейной модели и моделях, нели¬нейных по переменным, при оценке параметров исходят из кри¬терия min, то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным дан¬ным результативного признака, а к их преобразованным величи¬нам, т. е.ln y, 1/y. Так, в степенной функции МНК применяется к преобразованному уравнению lny = lnα + β ln x ln ε. Это значит, что оценка параметров основывается на миними¬зации суммы квадратов отклонений в логарифмах. Соответственно если в линейных моделях то в моделях, нелинейных по оцениваемым параметрам, . Вследствие этого оценка параметров оказываются несколько смещенной.
10 № 10 ПОКАЗАТЕЛИ КОРРЕЛЯЦИИ
1. индекс корреляции (R):
Величина данного показателя находится в границах: 0 ≤ R ≤ 1, чем ближе к 1, тем теснее связь рассматриваемых призна¬ков, тем более надежно найденное уравнение регрессии.
2. индекс детерминации используется для проверки существенности в целом ур-ия нелинейной регрессии по F- критерию Фишера:
, где R2- индекс детерминации, n- число наблюдений, m – число параметров при переменной х.
11 МНОЖЕСТВЕННАЯ РЕГРЕССИЯ. СПЕЦИФИКАЦИЯ МОДЕЛИ. ОТБОР ФАКТОРОВ ПРИ ПОСТРОЕНИИИ МОДЕЛИ.
Регрессия может дать хороший результат при модели¬ровании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономи¬ческих переменных контролировать нельзя, т. е. не удается обес¬печить равенство всех прочих условий для оценки влияния одно¬го исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. пост¬роить уравнение множественной регрессии: y=a+b1x1+b2+…+bpxp+e; Такого рода уравнение может использоваться при изучении потребления. Тогда коэффициенты bj — частные производные потребления у по соответствующим факторам xi: , в предположении, что все остальные хi постоянны. В 30-е гг. XX в. Кейнс сформулировал свою гипотезу потребительской функции. С того времени исследователи неод¬нократно обращались к проблеме ее совершенствования. Совре¬менная потребительская функция чаще всего рассматривается как модель вида: C=j(y,P,M,Z), где С — потребление; у — доход; Р — цена, индекс стоимости жизни; М — наличные деньги; Z — ликвидные активы. При этом .. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает в себя два круга вопросов: отбор фак¬торов и выбор вида уравнения регрессии. Требования к факторам.1 Они должны быть количественно измеримы. Если необхо¬димо включить в модель качественный фактор, не имеющий ко¬личественного измерения, то ему нужно придать количествен¬ную определенность (например, в модели урожайности качество почвы задается в виде баллов) 2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, когда Ryx1 Rx1x2.Для зависимости y=a+b1x1+b2+…+bpxp+e может привести к нежелательным последствиям, повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются не интерпретированными.
Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р-факторов, то для нее рассчитывается показа¬тель детерминации R2 , который фиксирует долю объясненной ва¬риации результативного признака за счет рассматриваемых в ре¬грессии р-факторов. Влияние других не учтенных в модели фак¬торов оценивается как 1 - R2 с соответствующей остаточной дис¬персией S2.При дополнительном включении в регрессию (р + 1) фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться: . Насыщение модели лишними факторами не только не снижа¬ет величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.
Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качест¬венного теоретико-экономического анализа, который обычно осуществляется в две стадии: на первой подби¬раются факторы исходя из сущности проблемы; на второй – на основе показателей корреляции определяют t-статистики для параметров регрессии. Коэффициенты интеркорреляции (т. е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если . Ес¬ли факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочте¬ние при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множест¬венной регрессии как метода исследования комплексного воз¬действия факторов в условиях их независимости друг от друга. Наибольшие труд¬ности в использовании аппарата множественной регрессии воз¬никают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимос¬тью. Наличие мультиколлинеарности факторов может озна¬чать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полно¬стью независимой, и нельзя оценить воздействие каждого факто¬ра в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК). Включение в модель мультиколлинеарных факторов нежела¬тельно в силу следующих последствий:1.затрудняется интерпретация параметров множественной ре¬грессии как характеристик действия факторов в «чистом» ви¬де, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;2оценки параметров ненадежны, обнаруживают большие стан¬дартные ошибки и меняются с изменением объема наблюде¬ний. Для оценки мультиколлинеарности факторов может исполь¬зоваться определитель матрицы парных коэффициентов корреля¬ции между факторами.
Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей. Для включающего три объ¬ясняющих переменных уравнения: y=a+b1x1+b2+b3x3+e.Матрица коэф-в корреляции м/у факторами имела бы определитель равный 1. Det =1, т.к. rx1x1=rx2x2=1 и rx1x2=rx1x3=rx2x3=0. Если м/у факторами сущ-ет полная линейная зависимость и все коэф-ты корреляции =1, то определитель такой матрицы =0. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной кор¬реляции, тем меньше мультиколлинеарность факторов.
12.Уравнение линейной множественной регрессии, нахождение к-тов модели.
Линейная модель множественной регрессии. У=а0+а1х1+ а2х2+…+ аmхm+e
Параметры определяются с помощью методов наименьших квадратов.
Для этого проведем все рассуждения в матричной форме. Введем следующие матричные обозначения:
;
где У вектор n значений результативного показателя.
Х – матрица n значений m независимых переменных; а матрица параметров
У=Х∙а+ε.
Заметим, что а – выборочные оценки совокупности.
Итак, метод наименьших квадратов требует мин-ии суммы квадратов отклонений исходных модели значений
,
Далее:
Из матричной алгебры известно, что , тогда:
1 – это есть матрица размерностью 1Х1, т.е. число-скаляр, а скаляр при трансформировании не меняется, поэтому
Согласно условию экстремума S по а =0
;
2ХТY+2aXTX=0
XTY=aXTX
Для погашения а умножим обе части этого уравнения на (ХТХ)-1, тогда
а= (XTХ)-1∙XTY
Решение задачи нахождения матицы, а возможно лишь в том случае, если строки и столбцы матрицы Х линейно независимы.
13 множественная корреляция и частичная корреляция
Эк явления как правило определяются большими числами одновременно и совокупно действующих факторов. В связи с этим возникает задача исследования зависимости одной (или нескольких) переменных у от совокупности переменных (х1 х2 … хm). В таком случае для измерения тесноты связи м\у У и факторными признаками хj (j =1 … n) используют множественных коэффициент корреляции.
Для этого используют матрицу парных коэффициентов корреляции м\у всеми рассматриваемыми переменными.
По этой матрице вычисляется множественный коэффициент корреляции, отражающий тесноту связи м/у Y и всеми остальными факторами.
, где R – алгебраические дополнения к соответствующим коэффициентам.
Частный коэффициент корреляции устанавливается зависимость м\у j-ым и k-ым фактором при исключении остальных.
14 НАЗНАЧЕНИЕ ЧАСТНОЙ КОРРЕЛЯЦИИ ПРИ ПОСТРОЕНИИ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ. Ранжирование факторов, участву¬ющих во множественной линейной регрессии, может быть прове¬дено через стандартизованные коэффициенты регрессии, с помо¬щью частных коэффициентов корреляции — для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включе¬ния того или иного фактора в модель доказывается величиной показателя частной корреляции.
Частные коэффициенты (или индексы) корреляции характери¬зуют тесноту связи между результатом и соответствующим фак¬тором при устранении влияния других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отно¬шение сокращения остаточной дисперсии за счет дополнитель¬ного включения в анализ нового фактора к остаточной диспер¬сии, имевшей место до введения его в модель.
Частные коэффициенты корреляции измеряющие влияние на у фактора хi при неизменном уровне др. факторов можно определить по формуле:
;
При двух факторах и i=1 данная формула примет вид:
Частные коэффициенты корреляции изменяются в пределах от -1 до 1.
15/16. ЧАСТНЫЙ F-КРИТЕРИЙ, ЕГО ОТЛИЧИЕ ОТ ПОСЛЕДОВАТЕЛЬНОГО F-КРИТЕРИЯ, СВЯЗЬ МЕЖДУ СОБОЙ t- КРИТЕРИЯ СТЬЮДЕНТА ДЛЯ ОЦЕНКИ ЗНАЧИМОСТИ bi И ЧАСТНЫМ F-КРИТЕРИЕМ.
Ввиду корреляции м/у факторами значимость одного и того же фактора м/б различной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частый F-критерий, т.е. Fxi. В общем виде для фактора xi частый F-критерий определяется как :
Если рас¬сматривается уравнение y=a+b1x1+b2+b3x3+e, то определяются последовательно F-критерий для уравнения с од¬ним фактором х1, далее F-критерий для дополнительного включе¬ния в модель фактора х2, т. е. для перехода от однофакторного уравнения регрессии к двухфакторному, и, наконец, F-критерий для дополнительного включения в модель фактора х3, т. е. дается оценка значимости фактора х3 после включения в модель факто¬ров x1 их2. В этом случае F-критерий для дополнительного вклю¬чения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения в модель фактора х3, который является частным F-критерием, ибо оценивает значи¬мость фактора в предположении, что он включен в модель по¬следним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели. Для уравнения y=a+b1x1+b2+b3x3+e оценка значимости коэффициентов регрессии Ь1,Ь2,,b3 предпола¬гает расчет трех межфакторных коэффициентов детерминации, а именно: , , и можно убедиться, что существует связь между собой t- критерия Стьюдента для оценки значимости bi и частным F-критерием:
На основе соотношения bi и получим:
19,20 ПРЕДПОСЫЛКИ МНК.
При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно составляющей , которая представляет собой ненаблюдаемую величину.
Исследования остатков - предполагают проверку наличия сле¬дующих пяти предпосылок МНК:1.случайный характер остатков; 2.нулевая средняя величина остатков, не зависящая от хi;
3.гомоскедастичность—дисперсия каждого отклонения ,одинакова для всех значений х; 4.отсутствие автокорреляции остатков. Значения остатков , распределены независимо друг от друга; 5.остатки подчиняются нормальному распределению.
1. Проверяется случайный характер остатков , с этой целью строится график зависимости остатков от теоретических значений результативного признака. Если на графике получена горизонтальная полоса, то остатки , представляют собой случайные величины и МНК оправдан, те¬оретические значения ух хорошо аппроксимируют фактические значения y. В других случаях необходимо либо применять дру¬гую функцию, либо вводить дополнительную информацию и за¬ново строить уравнение регрессии до тех пор, пока остатки , не будут случайными величинами.
2. Вторая предпосылка МНК относительно нулевой средней ве¬личины остатков означает, что (у — ух) = 0. Это выполнимо для линейных моделей и моделей, нелинейных относительно вклю¬чаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков от теоретических значений ре¬зультативного признака ух строится график зависимости случай¬ных остатков от факторов, включенных в регрессию хi . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xj. Если же график показывает наличие зависимости и хj то модель неадек¬ватна. Причины неадекватности могут быть разные.
3. В соответствии с третьей предпосылкой МНК требуется, что¬бы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки , имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. Гомоскедастичность остатков означает, что дисперсия остат¬ков - одинакова для каждого значения х.
4.Отсутствие автокор¬реляции остатков, т. е. значения остатков распределены неза¬висимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечива¬ет состоятельность и эффективность оценок коэффициентов ре¬грессии
21 СМЫСЛ ОБОБЩЕННОГО МНК.
При нарушении гомоскедастичности и наличии автокорреля¬ции ошибок рекомендуется традиционный МНК заменять обобщенным методом. Обобщенный МНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Обобщенный МНК для корректировки гетерос-ти. В общем виде для уравнения yi=a+bxi+ei при где Ki – коэф-т пропор-ти. Модель примет вид: yi= + xi+ ei . В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафик¬сированные в ходе i-го наблюдения на . Тогда дисперсия остатков будет величиной постоянной. От регрессии у по х мы перейдем к регрессии на новых переменных: y/ и х/ . Уравнение регрессии примет вид: . По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешен¬ную регрессию, в которой переменные у и х взяты с весами . Коэф-т регрессии b можно определить как Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэффициент регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.Аналогичный подход возможен не только для уравнения парной, но и для множественной регрессии. Модель примет вид: . Модель с преобразованными переменными составит
. Это уравнение не содер-т свобод-го члена, применяя обычный МНК получим: Применение в этом случае обобщенного МНК приводит к то¬му, что наблюдения с меньшими значениями преобразованных переменных х/К имеют при определении параметров регрессии относительно больший вес, чем с первоначальными переменны¬ми.
23. 25,26 СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ. ПРОБЛЕМА ИДЕНТИФИКАЦИИ.
Сложные экономические процессы описывают с помощью системы взаимосвязанных уравнений. Различают несколько видов систем уравнений: 1. Система независимых уравнений - когда каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х:
y1=a11*x1+a12*x2+…+a1m*xm+e1
yn=an1*x1+an2*x2+…+anm*xm+en
Для решения этой системы и нахождения ее параметров
используется МНК.
2.Система рекурсивных уравнений – когда зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении:
y1=a11*x1+a12*x2+…+a1m*xm+e1
y2=b21*y1+a21*x1+a22*x2+…+a2m*xm+e2
y3=b31*y1+b32*y2+a31*x1+a32*x2+…+a3m*xm+e3
yn=bn1*y1+bn2*y2+…+bnk-1*yn-1+an1*x1+an2*x2+…+anm*xm+en
Для решения этой системы и нахождения ее параметров используется МНК.
3 Система взаимосвязанных уравнений – когда одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую.
y1=b12*y2+b13*y3+…+b1n*yn+a11*x1+a12*x2+…+a1m*xm+e1
y2=b21*y1+b23*y3+…+b2n*yn+a21*x1+a22*x2+…+a2m*xm+e2
yn=bn1*y1+bn2*y2+…+bnk-1*yn-1+an1*x1+an2*x2+…+anm*xm+en
Такая система уравнений называется структурной формой модели. Эндогенные переменные – взаимосвязанные переменные, которые определяются внутри модели (системы) у. Экзогенные переменные – независимые переменные, которые определяются вне системы х. Предопределенные переменные – экзогенные и лаговые (за предыдущие моменты времени) эндогенные переменные системы. Коэффициенты a и b при переменных – структурные коэффициенты модели. Система линейных функций эндогенных переменных от всех предопределенных переменных системы - приведенная форма модели. где - коэффициенты приведенной формы модели.
Необходимое условие идентификации – выполнение счетного правила:
D+1=H –уравнение идентифицируемо;
D+1
Где Н – число эндогенных переменных в уравнении, D – число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе.
Достаточное условие идентификации- определитель матрицы, составленной из коэффициентов при переменных, отсутствующих в исследуемом уравнении на равен нулю и ранг этой матрицы не менее эндогенных переменных без единицы. Для решения идентифицируемого уравнения применяется КМНК, для решения сверхидентифицируемых - двухшаговый МНК.
27 Оценивание параметров структурной модели
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в литературе получили следующие методы оценивания коэффициентов структурной модели:
• косвенный метод наименьших квадратов (КМНК)
• двухшаговый метод наименьших квадратов (ДМНК)
• трехшаговый метод наименьших квадратов (ТМНК)
• метод максимального правдоподобия с полной информацией (ММП)
• метод максимального правдоподобия при ограниченной информации (ММП)
Косвенный и Двухшаговый методы наименьших квадратов подробно описаны в литературе и рассматриваются как традиционные методы оценки коэффициентов структурной модели. Эти методы достаточно легкореализуемы. Косвенный метод наименьших квадратов применяется для идетифицируемой системы одновременных уравнений, двухшаговый метод наименьших квадратов - для оценки коэффициентов сверхидентифицируемой модели. Перечисленные методы оценивания также используются для сверхидентифицируемых систем уравнений.
Метод максимального правдоподобия рассматривается как наиболее общий метод оценивания, результаты которого при нормальном распределении признаков совпадают с МНК. Однако при большом числе уравнений системы этот метод приводит к достаточно сложным вычислительным процедурам. Поэтому в качестве модификации используется метод максимального правдоподобия при ограниченной информации (метод наименьшего дисперсионного отношения) разработанный в 1949 г. Т. Андерсеном и Н. Рубинным. Математическое описание метода дано, например, в работе Дж. Джонстона. В отличие от метода максимального правдоподобия в данном методе сняты ограничения на параметры, связанные с функционированием системы в целом. Это делает решение более простым, но трудоемкость вычислений остается достаточно высокой. несмотря на его популярность, к середине 1960-х годов он был практически вытеснен двухшаговым методом наименьших квадратов в связи с гораздо большей простотой последнего. Этому способствовала также разработка в 1961 г. Г. Тейлом семейства оценок коэффициентов структурной модели. Для данной модели Г. Тейл определил семейство оценок класса К и обычный МНК при К = 0, ДМНК при К = 1 и метод ограниченной информации при plimK = 1. В последнем случае решение структурной модели соответствует оценкам по ДМНК.
Дальнейшим развитием двухшагового метода наименьших квадратов является трехшаговый МНК (ТМНК), предложенный в 1962 г. А. Зельнером и Г. Тейлом. Этот метод оценивания пригоден для всех видов уравнений структурной модели. Однако при некоторых ограничениях на параметры более эффективным оказывается ДМНК.
28 КМНК. Применяется в случае точно идентифицируемой модели. Процедура применения КМНК предполагает выполнение следующих этапов: 1. Составляют приведенную форму модели и определяют численные значения параметров для каждого ее уравнения обычным МНК. 2. путем алгебраических преобразований переходят от приведенной формы к уравнениям структурной формы модели, получая тем самым численные оценки структурных параметров.
Основная идея ДМНК — на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения. Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифи¬цируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной
и на втором шаге применительно к структурному сверхидентифицируемому уравнению при опре¬делении структурных коэффициентов модели по данным теоре¬тических (расчетных) значений эндогенных переменных.
Сверхидентифицируемая структурная модель может быть двух типов:
• все уравнения системы сверхидентифицируемы;
• система содержит наряду со сверхидентифицируемыми точно
идентифицируемые уравнения.
Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения исполь¬зуется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.
Применим ДМНК к простейшей сверхидентифицируемой
модели:
Данная модель может быть получена из предыдущей иденти¬фицируемой модели:
если наложить ограничения на ее параметры, а именно: b12 =a11
В результате первое уравнение стало сверхидентифицируемым: Н=1 (у1),
D=1(х2) и D+1 > Н. Второе уравнение не изме¬нилось и является точно идентифицируемым: Н = 2 и D=1
На первом шаге найдем приведенную форму модели, а
именно:
ДМНК является наиболее общим и широко распространен¬ным методом решения системы одновременных уравнений.
Несмотря на важность системы эконометрических уравнений, на практике часто не принимают во внимание некоторые взаимосвязи, применение традиционного МНК к одному или нескольким уравнениям также широко распространено в эконометрике. В частности, при построении производственных функций анализ спроса можно вести, используя обычный МНК.
29 ОСНОВНЫЕ ЭЛЕМЕНТЫ ВРЕМЕННОГО РЯДА.
Временной ряд — это совокупность значений какого-либо по¬казателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействие
Тэги: александр, гумф, сергеевич, трус, шпора, эконометрика, эконометрике
Комментарии | Постоянная ссылка
Есть еще одно занятие - Экзамен по эконометрике сдавать...
2011-10-30 21:54:54 (читать в оригинале)
Чтоб пусто было тому человеку кто в совершенстве знает эконометрику.... А если её ведет Трусов, то я уверен, что мало кто её знает впринципе =))) Этот пост чисто для меня, ибо сижу как дурак, готовлюсь к экзамену, к предмету которого не знаю... сколько раз я готовился и сдавал подобные сессии... но такой ещё не было. То что иде после черты не обязательно есть в вопросах по ТРУСОВУ Александру Сергеевичу, не если и этого не знать, или хотябы не прочесть то хана.
________________________________________________________________________________________________________________
________________________________________________________________________________________________________________
1 Эконометрика — наука, изучающая количественные и качественные экономические взаимосвязи с помощью математических и статистических методов и моделей[1]. Современное определение предмета эконометрики было выработано в уставе Эконометрического общества, которое главными целями назвало использование статистики и математики для развития экономической теории[2]. Теоретическая эконометрика рассматривает статистические свойства оценок и испытаний, в то время как прикладная эконометрика занимается применением эконометрических методов для оценки экономических теорий.
Эконометрический метод складывался в преодолении следующих неприятностей, искажающих результаты применения классических статистических методов:
• асимметричности связей;
• мультиколлинеарности объясняющих переменных;
• закрытости механизма связи между переменными в изолированной регрессии;
• эффекта гетероскедастичности, т. е. отсутствия нормального распределения остатков для регрессионной функции;
• автокорреляции;
• ложной корреляции;
• наличия лагов.
Эконометрическая модель, как правило, основана на теоретическом предположении о круге взаимосвязанных переменных и характере связи между ними. При всем стремлении к «наилучшему» описанию связей приоритет отдается качественному анализу. Поэтому в качестве этапов эконометрического исследования можно указать:
• постановку проблемы;
• получение данных, анализ их качества;
• спецификацию модели;
• оценку параметров;
• интерпретацию результатов.
3. Линейное уравнение регрессии, коэффициенты модели.
Линейная модель парной регрессии есть: у=а0+а1х+
а1 - коэф-т регрессии, показывающий, как изменится у при изменении х на единицу
а0 - это свободный член, расчетная величина, содержания нет.
- это остаточная компонента, т.е. случайная величина, независимая, нормально распределенная, мат ожид = 0 и постоянной дисперсией.
В матричной форме модель имеет вид:
Y=XA+ε
Где Y– вектор-столбец размерности (nx1) наблюдаемых значений зависимой переменной; Х– матрица размерности (nx2) наблюдаемых значений факторных признаков. Дополнительный фактор х0 вводится для вычисления свободного члена; А– вектор-столбец размерности (2х1) неизвестных, подлежащих оценке коэффициентов регрессии; ε– вектор-столбец размерности (nх1) ошибок наблюдений
;
Параметры модели находятся с использованием МНК. Подсчитывается сумма квадратов ошибок наблюдений.
4 ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ
Линейная регрессия сводится к нахождению уравнения вида или .
Уравнение вида позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.
Построение линейной регрессии сводится к оценке ее пара¬метров а и в.
Оценки параметров линейной регрессии могут быть найдены разными методами.
1.
2.
Параметр b называется коэффициентом регрессии. Его вели¬чина показывает среднее изменение результата с изменением фактора на одну единицу.
Формально а — значение у при х = 0. Если признак-фактор
не имеет и не может иметь нулевого значения, то вышеуказанная
трактовка свободного члена, а не имеет смысла. Параметр, а может
не иметь экономического содержания. Попытки экономически
интерпретировать параметр, а могут привести к абсурду, особенно при а < 0.
Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора.
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют разные модификации формулы линейного коэф¬фициента корреляции.
Линейный коэффициент корреляции находится и границах: -1≤.rxy ≤ 1. При этом чем ближе r к 0 тем слабее корреляция и наоборот чем ближе r к 1 или -1, тем сильнее корреляция, т.е. зависимость х и у близка к линейной. Если r в точности =1или -1 все точки лежат на одной прямой. Если коэф. регрессии b>0 то 0 ≤.rxy ≤ 1 и наоборот при b<0 -1≤.rxy ≤0. Коэф. корреляции отражает степени линейной зависимости м/у величинами при наличии ярко выраженной зависимости др. вида.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детермина¬ции характеризует долю дисперсии результативного признака y, объясняемую регрессией. Соответствующая величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.
5. ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ.
Оценка значимости уравнения регрессии в целом дается с по¬мощью F-критерия Фишера. При этом выдвигается нулевая ги¬потеза, что коэффициент регрессии равен нулю, т. е. b = 0, и следовательно, фактор х не оказывает влияния на результат у.
Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложе¬ние общей суммы квадратов отклонений переменной у от средне го значения у на две части - «объясненную» и «необъясненную»:
- общая сумма квадратов отклонений
- сумма квадратов отклонения объясненная регрессией - остаточная сумма квадратов отклонения.
Любая сумма квадратов отклонений связана с числом степе¬ней свободы, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности nис числом определяемых по ней констант. Применительно к исследуемой проблеме число cтепеней свободы должно показать, сколько независимых откло¬нений из п возможных требуется для образования данной суммы квадратов.
Дисперсия на одну степень свободы D.
F-отношения (F-критерий):
Ecли нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором раз¬работаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным, если о больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт > Fтабл Н0 отклоняется.
Если же величина окажется меньше табличной Fфакт ‹, Fтабл , то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Но не отклоняется.
Стандартная ошибка коэффициента регрессии
Для оценки существенности коэффициента регрессии его ве¬личина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдентa: которое
затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы (n- 2).
Стандартная ошибка параметра а:
Значимость линейного коэффициента корреляции проверя¬ется на основе величины ошибки коэффициента корреляции тr:
Общая дисперсия признака х:
Коэф. регрессии Его величина показывает ср. изменение результата с изменением фактора на 1 ед.
Ошибка аппроксимации:
6,5. ИНТЕРВАЛЫ ПРОГНОЗА ПО ЛИНЕЙНОМУ УРАВНЕНИЮ РЕГРЕССИИ
Оценка стат. значимости параметров регрессии проводится с помощью t – статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигается гипотеза Н0 о статистически значимом отличие показателей от 0 a = b = r = 0. Рассчитываются стандартные ошибки параметров a,b, r и фактич. знач. t – критерия Стьюдента.
Определяется стат. значимость параметров.
ta ›Tтабл - a стат. значим
tb ›Tтабл - b стат. значим
Находятся границы доверительных интервалов.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что параметры a и b находясь в указанных границах не принимают нулевых значений, т.е. не явл.. стат. незначимыми и существенно отличается от 0.
7. НЕЛИНЕЙНАЯ РЕГРЕССИЯ. ВИДЫ МОДЕЛЕЙ
Если между экономическими явлениями существуют нели¬нейные соотношения, то они выражаются с помощью соответ¬ствующих нелинейных функций: например, равносторонней ги¬перболы , параболы второй степени и д.р.
Различают два класса нелинейных регрессий:
• регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым па¬раметрам;
• регрессии, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии по включаемым в нее объ¬ясняющим переменным могут служить следующие функции:
• полиномы разных степеней
• равносторонняя гипербола
К нелинейным регрессиям по оцениваемым параметрам от¬носятся функции:
• степенная
• показательная
экспоненциальная
8,9 ПРИМЕНЕНИЕ МНК К МОДЕЛЯМ НЕЛИНЕЙНЫМ ОТНОСИТЕЛЬНО ВКЛЮЧАЕМЫХ ПЕРЕМЕННЫХ И ОЦЕНИВАЕМЫХ ПАРАМЕТРОВ.
Нелинейная регрессия по включенным переменным не таит каких-либо сложностей в оценке ее параметров. Она определяет¬ся, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в парабо¬ле второй степени y=a0+a1x+a2x2+ε заменяя переменные x=x1,x2=x2, получим двухфакторное урав¬нение линейной регрессии: у=а0+а1х1+а2х2+ ε
Парабола второй степени целесообразна к применению, если для определенного интервала значений фактора меняется харак¬тер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. В этом случае определяется значение фактора, при котором достигается максимальное (или минимальное), значение результативного признака: приравнива¬ем к нулю первую производную параболы второй степени: , т.е. b+2cx=0 и x=-b/2c
Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:
Решение ее возможно методом определителей:
В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразо¬ванным уравнениям. Если в линейной модели и моделях, нели¬нейных по переменным, при оценке параметров исходят из кри¬терия min, то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным дан¬ным результативного признака, а к их преобразованным величи¬нам, т. е.ln y, 1/y. Так, в степенной функции МНК применяется к преобразованному уравнению lny = lnα + β ln x ln ε. Это значит, что оценка параметров основывается на миними¬зации суммы квадратов отклонений в логарифмах. Соответственно если в линейных моделях то в моделях, нелинейных по оцениваемым параметрам, . Вследствие этого оценка параметров оказываются несколько смещенной.
10 № 10 ПОКАЗАТЕЛИ КОРРЕЛЯЦИИ
1. индекс корреляции (R):
Величина данного показателя находится в границах: 0 ≤ R ≤ 1, чем ближе к 1, тем теснее связь рассматриваемых призна¬ков, тем более надежно найденное уравнение регрессии.
2. индекс детерминации используется для проверки существенности в целом ур-ия нелинейной регрессии по F- критерию Фишера:
, где R2- индекс детерминации, n- число наблюдений, m – число параметров при переменной х.
11 МНОЖЕСТВЕННАЯ РЕГРЕССИЯ. СПЕЦИФИКАЦИЯ МОДЕЛИ. ОТБОР ФАКТОРОВ ПРИ ПОСТРОЕНИИИ МОДЕЛИ.
Регрессия может дать хороший результат при модели¬ровании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономи¬ческих переменных контролировать нельзя, т. е. не удается обес¬печить равенство всех прочих условий для оценки влияния одно¬го исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. пост¬роить уравнение множественной регрессии: y=a+b1x1+b2+…+bpxp+e; Такого рода уравнение может использоваться при изучении потребления. Тогда коэффициенты bj — частные производные потребления у по соответствующим факторам xi: , в предположении, что все остальные хi постоянны. В 30-е гг. XX в. Кейнс сформулировал свою гипотезу потребительской функции. С того времени исследователи неод¬нократно обращались к проблеме ее совершенствования. Совре¬менная потребительская функция чаще всего рассматривается как модель вида: C=j(y,P,M,Z), где С — потребление; у — доход; Р — цена, индекс стоимости жизни; М — наличные деньги; Z — ликвидные активы. При этом .. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает в себя два круга вопросов: отбор фак¬торов и выбор вида уравнения регрессии. Требования к факторам.1 Они должны быть количественно измеримы. Если необхо¬димо включить в модель качественный фактор, не имеющий ко¬личественного измерения, то ему нужно придать количествен¬ную определенность (например, в модели урожайности качество почвы задается в виде баллов) 2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, когда Ryx1 Rx1x2.Для зависимости y=a+b1x1+b2+…+bpxp+e может привести к нежелательным последствиям, повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются не интерпретированными.
Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р-факторов, то для нее рассчитывается показа¬тель детерминации R2 , который фиксирует долю объясненной ва¬риации результативного признака за счет рассматриваемых в ре¬грессии р-факторов. Влияние других не учтенных в модели фак¬торов оценивается как 1 - R2 с соответствующей остаточной дис¬персией S2.При дополнительном включении в регрессию (р + 1) фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться: . Насыщение модели лишними факторами не только не снижа¬ет величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.
Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качест¬венного теоретико-экономического анализа, который обычно осуществляется в две стадии: на первой подби¬раются факторы исходя из сущности проблемы; на второй – на основе показателей корреляции определяют t-статистики для параметров регрессии. Коэффициенты интеркорреляции (т. е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если . Ес¬ли факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочте¬ние при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множест¬венной регрессии как метода исследования комплексного воз¬действия факторов в условиях их независимости друг от друга. Наибольшие труд¬ности в использовании аппарата множественной регрессии воз¬никают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимос¬тью. Наличие мультиколлинеарности факторов может озна¬чать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полно¬стью независимой, и нельзя оценить воздействие каждого факто¬ра в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК). Включение в модель мультиколлинеарных факторов нежела¬тельно в силу следующих последствий:1.затрудняется интерпретация параметров множественной ре¬грессии как характеристик действия факторов в «чистом» ви¬де, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;2оценки параметров ненадежны, обнаруживают большие стан¬дартные ошибки и меняются с изменением объема наблюде¬ний. Для оценки мультиколлинеарности факторов может исполь¬зоваться определитель матрицы парных коэффициентов корреля¬ции между факторами.
Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей. Для включающего три объ¬ясняющих переменных уравнения: y=a+b1x1+b2+b3x3+e.Матрица коэф-в корреляции м/у факторами имела бы определитель равный 1. Det =1, т.к. rx1x1=rx2x2=1 и rx1x2=rx1x3=rx2x3=0. Если м/у факторами сущ-ет полная линейная зависимость и все коэф-ты корреляции =1, то определитель такой матрицы =0. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной кор¬реляции, тем меньше мультиколлинеарность факторов.
12.Уравнение линейной множественной регрессии, нахождение к-тов модели.
Линейная модель множественной регрессии. У=а0+а1х1+ а2х2+…+ аmхm+e
Параметры определяются с помощью методов наименьших квадратов.
Для этого проведем все рассуждения в матричной форме. Введем следующие матричные обозначения:
;
где У вектор n значений результативного показателя.
Х – матрица n значений m независимых переменных; а матрица параметров
У=Х∙а+ε.
Заметим, что а – выборочные оценки совокупности.
Итак, метод наименьших квадратов требует мин-ии суммы квадратов отклонений исходных модели значений
,
Далее:
Из матричной алгебры известно, что , тогда:
1 – это есть матрица размерностью 1Х1, т.е. число-скаляр, а скаляр при трансформировании не меняется, поэтому
Согласно условию экстремума S по а =0
;
2ХТY+2aXTX=0
XTY=aXTX
Для погашения а умножим обе части этого уравнения на (ХТХ)-1, тогда
а= (XTХ)-1∙XTY
Решение задачи нахождения матицы, а возможно лишь в том случае, если строки и столбцы матрицы Х линейно независимы.
13 множественная корреляция и частичная корреляция
Эк явления как правило определяются большими числами одновременно и совокупно действующих факторов. В связи с этим возникает задача исследования зависимости одной (или нескольких) переменных у от совокупности переменных (х1 х2 … хm). В таком случае для измерения тесноты связи м\у У и факторными признаками хj (j =1 … n) используют множественных коэффициент корреляции.
Для этого используют матрицу парных коэффициентов корреляции м\у всеми рассматриваемыми переменными.
По этой матрице вычисляется множественный коэффициент корреляции, отражающий тесноту связи м/у Y и всеми остальными факторами.
, где R – алгебраические дополнения к соответствующим коэффициентам.
Частный коэффициент корреляции устанавливается зависимость м\у j-ым и k-ым фактором при исключении остальных.
14 НАЗНАЧЕНИЕ ЧАСТНОЙ КОРРЕЛЯЦИИ ПРИ ПОСТРОЕНИИ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ. Ранжирование факторов, участву¬ющих во множественной линейной регрессии, может быть прове¬дено через стандартизованные коэффициенты регрессии, с помо¬щью частных коэффициентов корреляции — для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включе¬ния того или иного фактора в модель доказывается величиной показателя частной корреляции.
Частные коэффициенты (или индексы) корреляции характери¬зуют тесноту связи между результатом и соответствующим фак¬тором при устранении влияния других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отно¬шение сокращения остаточной дисперсии за счет дополнитель¬ного включения в анализ нового фактора к остаточной диспер¬сии, имевшей место до введения его в модель.
Частные коэффициенты корреляции измеряющие влияние на у фактора хi при неизменном уровне др. факторов можно определить по формуле:
;
При двух факторах и i=1 данная формула примет вид:
Частные коэффициенты корреляции изменяются в пределах от -1 до 1.
15/16. ЧАСТНЫЙ F-КРИТЕРИЙ, ЕГО ОТЛИЧИЕ ОТ ПОСЛЕДОВАТЕЛЬНОГО F-КРИТЕРИЯ, СВЯЗЬ МЕЖДУ СОБОЙ t- КРИТЕРИЯ СТЬЮДЕНТА ДЛЯ ОЦЕНКИ ЗНАЧИМОСТИ bi И ЧАСТНЫМ F-КРИТЕРИЕМ.
Ввиду корреляции м/у факторами значимость одного и того же фактора м/б различной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частый F-критерий, т.е. Fxi. В общем виде для фактора xi частый F-критерий определяется как :
Если рас¬сматривается уравнение y=a+b1x1+b2+b3x3+e, то определяются последовательно F-критерий для уравнения с од¬ним фактором х1, далее F-критерий для дополнительного включе¬ния в модель фактора х2, т. е. для перехода от однофакторного уравнения регрессии к двухфакторному, и, наконец, F-критерий для дополнительного включения в модель фактора х3, т. е. дается оценка значимости фактора х3 после включения в модель факто¬ров x1 их2. В этом случае F-критерий для дополнительного вклю¬чения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения в модель фактора х3, который является частным F-критерием, ибо оценивает значи¬мость фактора в предположении, что он включен в модель по¬следним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели. Для уравнения y=a+b1x1+b2+b3x3+e оценка значимости коэффициентов регрессии Ь1,Ь2,,b3 предпола¬гает расчет трех межфакторных коэффициентов детерминации, а именно: , , и можно убедиться, что существует связь между собой t- критерия Стьюдента для оценки значимости bi и частным F-критерием:
На основе соотношения bi и получим:
19,20 ПРЕДПОСЫЛКИ МНК.
При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно составляющей , которая представляет собой ненаблюдаемую величину.
Исследования остатков - предполагают проверку наличия сле¬дующих пяти предпосылок МНК:1.случайный характер остатков; 2.нулевая средняя величина остатков, не зависящая от хi;
3.гомоскедастичность—дисперсия каждого отклонения ,одинакова для всех значений х; 4.отсутствие автокорреляции остатков. Значения остатков , распределены независимо друг от друга; 5.остатки подчиняются нормальному распределению.
1. Проверяется случайный характер остатков , с этой целью строится график зависимости остатков от теоретических значений результативного признака. Если на графике получена горизонтальная полоса, то остатки , представляют собой случайные величины и МНК оправдан, те¬оретические значения ух хорошо аппроксимируют фактические значения y. В других случаях необходимо либо применять дру¬гую функцию, либо вводить дополнительную информацию и за¬ново строить уравнение регрессии до тех пор, пока остатки , не будут случайными величинами.
2. Вторая предпосылка МНК относительно нулевой средней ве¬личины остатков означает, что (у — ух) = 0. Это выполнимо для линейных моделей и моделей, нелинейных относительно вклю¬чаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков от теоретических значений ре¬зультативного признака ух строится график зависимости случай¬ных остатков от факторов, включенных в регрессию хi . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xj. Если же график показывает наличие зависимости и хj то модель неадек¬ватна. Причины неадекватности могут быть разные.
3. В соответствии с третьей предпосылкой МНК требуется, что¬бы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки , имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. Гомоскедастичность остатков означает, что дисперсия остат¬ков - одинакова для каждого значения х.
4.Отсутствие автокор¬реляции остатков, т. е. значения остатков распределены неза¬висимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечива¬ет состоятельность и эффективность оценок коэффициентов ре¬грессии
21 СМЫСЛ ОБОБЩЕННОГО МНК.
При нарушении гомоскедастичности и наличии автокорреля¬ции ошибок рекомендуется традиционный МНК заменять обобщенным методом. Обобщенный МНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Обобщенный МНК для корректировки гетерос-ти. В общем виде для уравнения yi=a+bxi+ei при где Ki – коэф-т пропор-ти. Модель примет вид: yi= + xi+ ei . В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафик¬сированные в ходе i-го наблюдения на . Тогда дисперсия остатков будет величиной постоянной. От регрессии у по х мы перейдем к регрессии на новых переменных: y/ и х/ . Уравнение регрессии примет вид: . По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешен¬ную регрессию, в которой переменные у и х взяты с весами . Коэф-т регрессии b можно определить как Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэффициент регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.Аналогичный подход возможен не только для уравнения парной, но и для множественной регрессии. Модель примет вид: . Модель с преобразованными переменными составит
. Это уравнение не содер-т свобод-го члена, применяя обычный МНК получим: Применение в этом случае обобщенного МНК приводит к то¬му, что наблюдения с меньшими значениями преобразованных переменных х/К имеют при определении параметров регрессии относительно больший вес, чем с первоначальными переменны¬ми.
23. 25,26 СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ. ПРОБЛЕМА ИДЕНТИФИКАЦИИ.
Сложные экономические процессы описывают с помощью системы взаимосвязанных уравнений. Различают несколько видов систем уравнений: 1. Система независимых уравнений - когда каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х:
y1=a11*x1+a12*x2+…+a1m*xm+e1
yn=an1*x1+an2*x2+…+anm*xm+en
Для решения этой системы и нахождения ее параметров
используется МНК.
2.Система рекурсивных уравнений – когда зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении:
y1=a11*x1+a12*x2+…+a1m*xm+e1
y2=b21*y1+a21*x1+a22*x2+…+a2m*xm+e2
y3=b31*y1+b32*y2+a31*x1+a32*x2+…+a3m*xm+e3
yn=bn1*y1+bn2*y2+…+bnk-1*yn-1+an1*x1+an2*x2+…+anm*xm+en
Для решения этой системы и нахождения ее параметров используется МНК.
3 Система взаимосвязанных уравнений – когда одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую.
y1=b12*y2+b13*y3+…+b1n*yn+a11*x1+a12*x2+…+a1m*xm+e1
y2=b21*y1+b23*y3+…+b2n*yn+a21*x1+a22*x2+…+a2m*xm+e2
yn=bn1*y1+bn2*y2+…+bnk-1*yn-1+an1*x1+an2*x2+…+anm*xm+en
Такая система уравнений называется структурной формой модели. Эндогенные переменные – взаимосвязанные переменные, которые определяются внутри модели (системы) у. Экзогенные переменные – независимые переменные, которые определяются вне системы х. Предопределенные переменные – экзогенные и лаговые (за предыдущие моменты времени) эндогенные переменные системы. Коэффициенты a и b при переменных – структурные коэффициенты модели. Система линейных функций эндогенных переменных от всех предопределенных переменных системы - приведенная форма модели. где - коэффициенты приведенной формы модели.
Необходимое условие идентификации – выполнение счетного правила:
D+1=H –уравнение идентифицируемо;
D+1
Где Н – число эндогенных переменных в уравнении, D – число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе.
Достаточное условие идентификации- определитель матрицы, составленной из коэффициентов при переменных, отсутствующих в исследуемом уравнении на равен нулю и ранг этой матрицы не менее эндогенных переменных без единицы. Для решения идентифицируемого уравнения применяется КМНК, для решения сверхидентифицируемых - двухшаговый МНК.
27 Оценивание параметров структурной модели
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в литературе получили следующие методы оценивания коэффициентов структурной модели:
• косвенный метод наименьших квадратов (КМНК)
• двухшаговый метод наименьших квадратов (ДМНК)
• трехшаговый метод наименьших квадратов (ТМНК)
• метод максимального правдоподобия с полной информацией (ММП)
• метод максимального правдоподобия при ограниченной информации (ММП)
Косвенный и Двухшаговый методы наименьших квадратов подробно описаны в литературе и рассматриваются как традиционные методы оценки коэффициентов структурной модели. Эти методы достаточно легкореализуемы. Косвенный метод наименьших квадратов применяется для идетифицируемой системы одновременных уравнений, двухшаговый метод наименьших квадратов - для оценки коэффициентов сверхидентифицируемой модели. Перечисленные методы оценивания также используются для сверхидентифицируемых систем уравнений.
Метод максимального правдоподобия рассматривается как наиболее общий метод оценивания, результаты которого при нормальном распределении признаков совпадают с МНК. Однако при большом числе уравнений системы этот метод приводит к достаточно сложным вычислительным процедурам. Поэтому в качестве модификации используется метод максимального правдоподобия при ограниченной информации (метод наименьшего дисперсионного отношения) разработанный в 1949 г. Т. Андерсеном и Н. Рубинным. Математическое описание метода дано, например, в работе Дж. Джонстона. В отличие от метода максимального правдоподобия в данном методе сняты ограничения на параметры, связанные с функционированием системы в целом. Это делает решение более простым, но трудоемкость вычислений остается достаточно высокой. несмотря на его популярность, к середине 1960-х годов он был практически вытеснен двухшаговым методом наименьших квадратов в связи с гораздо большей простотой последнего. Этому способствовала также разработка в 1961 г. Г. Тейлом семейства оценок коэффициентов структурной модели. Для данной модели Г. Тейл определил семейство оценок класса К и обычный МНК при К = 0, ДМНК при К = 1 и метод ограниченной информации при plimK = 1. В последнем случае решение структурной модели соответствует оценкам по ДМНК.
Дальнейшим развитием двухшагового метода наименьших квадратов является трехшаговый МНК (ТМНК), предложенный в 1962 г. А. Зельнером и Г. Тейлом. Этот метод оценивания пригоден для всех видов уравнений структурной модели. Однако при некоторых ограничениях на параметры более эффективным оказывается ДМНК.
28 КМНК. Применяется в случае точно идентифицируемой модели. Процедура применения КМНК предполагает выполнение следующих этапов: 1. Составляют приведенную форму модели и определяют численные значения параметров для каждого ее уравнения обычным МНК. 2. путем алгебраических преобразований переходят от приведенной формы к уравнениям структурной формы модели, получая тем самым численные оценки структурных параметров.
Основная идея ДМНК — на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения. Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифи¬цируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной
и на втором шаге применительно к структурному сверхидентифицируемому уравнению при опре¬делении структурных коэффициентов модели по данным теоре¬тических (расчетных) значений эндогенных переменных.
Сверхидентифицируемая структурная модель может быть двух типов:
• все уравнения системы сверхидентифицируемы;
• система содержит наряду со сверхидентифицируемыми точно
идентифицируемые уравнения.
Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения исполь¬зуется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.
Применим ДМНК к простейшей сверхидентифицируемой
модели:
Данная модель может быть получена из предыдущей иденти¬фицируемой модели:
если наложить ограничения на ее параметры, а именно: b12 =a11
В результате первое уравнение стало сверхидентифицир
Тэги: александр, гумф, сергеевич, трус, шпора, эконометрика, эконометрике
Комментарии | Постоянная ссылка
Есть такое занятие - Экзамены сдавать ИСЭ
2011-10-27 14:22:47 (читать в оригинале)
Есть такое занятие - Экзамены сдавать ИСЭ
2011-10-27 14:22:47 (читать в оригинале)
CASE – это-технология и инструментальные средства автоматизированного проектирования систем
Data Mining-ориентированы на проверку не сформулированных гипотез
Аддитивный факт-Можно суммировать по всем измерениям
Алгоритм конструирования дерева решений-не требует от пользователя выбора входных атрибутов
Ассоциация -поиск закономерности между связанными событиями в наборе данных
Бинарной классификации-зависимая переменная может принимать только два значения
В аналитической системе "Бюджет Аналитик" чем является "Классификатор доходов бюджета"?-Измерение
В аналитической системе "Бюджет Аналитик" чем является "Поступления"?-Показатель
В какой модели жизненного цикла реализуемость технических решений *проверяется путем создания прототипов-RAD
В каком ответе говорится о частичном обобщении данных в хранилище?-Информация о доходах бюджета хранится по месяцам
В многомерных гиперкубах-осями куба являются измерения
В нотации IDEF0 стрелка, подходящая к левой грани функционального блока, относится к типу-Вход
В системе "бюджет-аналитик" нужно выбрать 3 налоговых инспекции, через которые получены максимальные поступления доходов. Какой инструмент выбора данных использовать?-Выбор лучших/худших
В системе "бюджет-аналитик" нужно выбрать дни заданного месяца. Какое измерение нужно зафиксировать перед входом в инструменты выбора данных?-Время
В системе "бюджет-аналитик" нужно выбрать дни заданного месяца. Какой инструмент выбора данных использовать?-Список
В системе "бюджет-аналитик" нужно выбрать налоги, поступления по которым лежат в заданных пределах. Каойк инструмент выбора данных использовать?-Выбор по исключению
В системе "бюджет-аналитик" нужно выбрать налоги. Какое измерение нужно зафиксировать перед входом в инструменты выбора данных?-Классификатор доходов
В системе "бюджет-аналитик" нужно найти корреспондента по известному имени. Какой инструмент выбора данных-использовать?-Поиск по совпадению
В состав инвариантных компонент интегрированных ИС входят-WORKFLOW, GROUPWARE, DocFLOW, Виртуальное предприятие, CALS-технология
В чем отличие добычи данных от традиционных средств анализа?-Наличие зависимостей априори неизвестно
Для порядковой шкалы не применима операция-сложение
Для чего нужна таблица покрытий?-Для задания отсутствующих фактов
Если стрелка на диаграмме имеет тоннель с круглыми скобками, то-Разрешен
Жизненный цикл отражает различные состояния системы-Начинается с момента принятия решения о необходимости его создания и заканчивается в момент его полного изъятия из эксплуатации.
Зависит ли набор измерений многомерного куба от информации в связанной с ним транзакционной системе?-Да
Иерархическая кластеризация использует-агломеративные методы и дивизимные методы
Иерархия измерения-определяет направление агрегирования показателей
Измерение "Классификатор расходов" содержит несколько иерархий?-Да
Итеративные методы кластеризации-Используются при большом количестве наблюдений
К какому виду программного обеспечения относятся СУБД? -Прикладное общего назначения
Как называются статьи расходов в AllFusion Process?-Центры затрат
Какая группа процессов не определена международным стандартом ISO/IEC 12207?-управляющие процессы
Какая команда контекстного меню в MS Excel используется для агрегирования данных?-Скрыть детали
Какая команда контекстного меню в MS Excel используется для дезагрегирования данных?-Отобразить детали
Какая методология лежит в основе IDEF0?-SADT
Какая модель не является моделью жизненного цикла?-структурная
Какая характеристика относится к каскадной модели ЖЦ?-Переход с одного этапа на следующий происходит только после того, как будет полностью завершена работа на текущем
Какая характеристика относится к спиральной модели ЖЦ?-Каждый виток спирали соответствует созданию фрагмента или версии ПО
Какие значения правильны для листа бинарного дерева классификации?-пасмурно, солнечно
Какие инструменты выбора данных в системе "бюджет-аналитик" нельзя использовать для выбора показателей?-Сортировка
Какие параметры используются для расчета стоимости выполнения работы?-Частота, продолжительность, стоимость работы
Какие понятия относятся к модели данных хранилища?-Измерения, факты, иерархия
Какие стрелки НЕ могут присутствовать на DFD-диаграмме?-Механизм
Какие характеристики не относятся к хранилищу данных?-Предназначен для обработки транзакций
Каким образом определяются стоимостные затраты на выполнение контекстной работы?-Сумма затрат всех декомпозированных работ
Какое из определений не относится к типам шкал?-символьная
Какое из перечисленных видов обеспечения ИС соответственно ГОСТ 34.602-89 отсутствует:-Сопровождение
Какое из утверждений правильно?-Большие коррекции весов могут привести к постоянной неустойчивости процесса обучения.
Какое из утверждений правильно?-Чем меньше приращение весов, тем меньше скорость обучения нейронной сети
Какое определение для хранилища данных правильно?-Предметно-ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений
Какое утверждение верно?-Переменная изначально не является зависимой или независимой.
Какой графический элемент отсутствует в нотации IDEF3?-Хранилище
Какой из перечисленных графических элементов не входит в диаграмму IDEF0?-Хранилище
Какой инструмент MS Excel используется для анализа многомерных данных?-Сводная таблица
Какой международный стандарт определяет структуру жизненного цикла ИС?-ISO/IEC 12207
Какой пример относится к выявляемой закономерности типа кластеризация?-Выделяются однородные заранее неизвестные группы покупателей
Какой список включает только измерения системы "бюджет-аналитик"-Время, ИМНС, Классификатор доходов, Счета бюджета
Какой список определяет технологии аналитической обработки информации?-OLAP, Data Mining, Хранилище данных
Какой тип стрелки отсутствует среди перечисленных ниже стрелок IDEF0-диаграммы: вход, вызов, управление, механизм,?-Выход
Классификация-Обнаруживаются условия (признаки), которые характеризуют группы объектов
Кластеризация-Разбиение объектов на группы
Менеджер хранилища выполняет операции-Анализ непротиворечивости и очистка данных
Методология моделирования, использующая только два графических элемента: функциональный блок и стрелку, называется-IDEF0
Методология моделирования, использующая четыре графических элемента: функциональный блок, стрелку, хранилище данных и внешние сущности, называется-DFD
Мигрируют ли граничные стрелки при декомпозиции IDEF0 в DFD?-Нет
Мигрируют ли граничные стрелки при декомпозиции IDEF0 в IDEF3?-Нет
Можно ли для нормирования переменных в кластерном анализе использовать экспертные оценки?-Да
На входе перекрестка Асинхронное "Или" одна стрелка. Сколько стрелок должно быть на выходе-Больше одной
На входе перекрестка Исключающее "ИЛИ" два процесса . Для такого перекрестка справедливо утверждение:-Только один предшествующий процесс завершен
На входе перекрестка Синхронное "И" два процесса . Для такого перекрестка справедливо утверждение-Все предшествующие процессы завершены одновременно
На входе перекрестка Синхронное "Или" две стрелки. Сколько стрелок должно быть на выходе-Одна
На выходе перекрестка Асинхронное "И" три процесса. Для такого перекрестка справедливо утверждение:-Все следующие процессы должны быть запущены
На выходе перекрестка Асинхронное "Или" три процесса. Для такого перекрестка справедливо утверждение-Один или несколько следующих процессов должны быть запущены
На выходе перекрестка Исключающее "ИЛИ" три процесса. Для такого перекрестка справедливо утверждение:-Только один следующий процесс запускается
На каких этапах ЖЦ проводится моделирование бизнес-процессов?-Начало и проектирование
На какой диаграмме должны размещаться цель и точка зрения модели?-Контекстная
На основе созданных измерений можно построить-несколько разных кубов
Нейронная сеть может иметь-много входов и выходов
Область применения нейронных сетей:-процессы, характеризующиеся набором параметров, связанных неизвестной функциональной зависимостью.
Обобщение-способность нейронной сети делать точный прогноз на данных, не принадлежащих исходному обучающему множеству
Одномерная классификация-по одному признаку
Оперативная аналитическая обработка относится к-неглубокому уровню получаемых знаний
Относительная шкала...-является числовой
Перед "сливающим" перекрестком "Синхронный ИЛИ" функции заканчиваются-В любой комбинации Одновременно
Перечисленные задачи относятся к Data Mining-Кластеризация, Классификация, Прогнозирование, Анализ связей
Персептрон -один слой искусственных нейронов, соединенных с помощью весовых коэффициентов с множеством входов.
Полуаддитивный факт-можно суммировать вдоль определённых измерений
После разветвляющего перекрестка "Синхронный И" функции начинаются-Все одновременно
Почему в автоматизированных системах операционной обработки информации трудно проводить анализ?-Для создания аналитического запроса необходимо знать структуру таблиц и связей БД
При выборе нескольких худших корреспондентов по показателю "Поступления доходов бюджета" что нужно сделать, чтобыне выводились неплательщики?-Поставить флажок исключить 0
При кластеризации классы объектов-изначально не предопределены.
При кластеризации-могут быть спорные объекты
Проблема владение данными для хранилищ данных-Интегрируются данные, принадлежащие разным владельцам
Проблема недооценки ресурсов, необходимых для загрузки данных.-Источники данных в разных БД
Разрешает ли нотация IDEF3 проводить слияние и разветвление стрелок без перекрестков?-Нет
Решения задач Data Mining-имеют два основных этапа
Синапсы нейронной сети-умножают входной сигнал на число, характеризующее силу связи
Система для расчета зарплаты в организации относится к-Специализированная, офисная, проблемно-ориентированная
Сколько FEO-диаграмм можно создать?-Любое количество
Сколько иерархий может быть в измерении?-несколько
Сколько типов перекрестков используется в нотации IDEF3-5
Скрытые проблемы источников данных для хранилищ данных-Поля данных системы операционной обработки не заполняются
Следующие данные относятся к дихотомической шкале-мужчина, женщина
Снимок данных-не обеспечивает хранения истории изменений
Событийная модель-подходит для моделирования транзакций
Стрелка на диаграмме IDEF0, изображающая связь между работами, может выходить из-Выход
Сумматор нейронной сети-вычисляет скалярное произведение вектора входных сигналов и вектора весовых коэффициентов
Тестовое множество-содержит входные и выходные значения примеров.
Управление конфигурацией ИС по стандарту ISO/IEC 12207 относится к группе-Вспомогательных процессов
Управление созданием ИС по стандарту ISO/IEC 12207 относится к группе-Основных процессов
Функция активации-может принимать значения в заданном диапазоне
Чем больше количество входов-тем больше должно быть обучающих фактов
Что значит привязка ко времени данных в хранилищах?-Данные индексируются по временным периодам
Что означает интегрированность хранилища данных?-Данные поступают из разных источников
Что определяет размерность многомерного куба?-Измерения
Что определяется в процессе обучения нейронной сети?-значений весовых (синаптических) коэффициентов
Что такое FEO-диаграмма в BPWin?-Диаграмма используемая для иллюстрации других точек зрения или для отображения отдельных деталей
Что такое реинжиниринг бизнес-процессов?-Реорганизация
Что такое сценарий в BPWin?-Последовательности обработки заказа или события, которые необходимо обработать за конечное время
Что хранится в ячейках куба?-Показатели
Что является центром схемы звезда?-Таблица фактов
Элемент Перекресток применяется для создания диаграмм в нотации-IDEF3
Элемент Работа применяется для создания диаграмм в нотации-IDEF3
принципы - хорошие
2011-10-25 15:46:17 (читать в оригинале)
Это цитата сообщения мастеровой Оригинальное сообщение
1. Старайтесь всегда быть в хорошем ровном настроении, стремитесь к спокойствию и счастью, хорошее настроение не является результатом стечения обстоятельств, а достигается постоянной работой над собой.
2. Находите в окружающих вас людях положительные черты характера. Ищите для себя хороших, честных, духовных друзей — это залог вашего счастья и здоровья. Не доверяйте свои мысли обманщикам и сплетникам, а если пришлось иметь такое общение не надо их обсуждать и ненавидеть.
3. Учитесь замечать в окружающем вас мире красоту и гармонию.
4. Реагируйте в толпе на улыбку и смех, а не на грубое слово; не вступайте в конфликт, если не уверены в своих способностях остаться спокойным и доброжелательным.
5. Относитесь к своей раздражительности как к большому невежеству, которое приводит к болезням, не позволяйте себе безволие.
6. Совершив недостойный поступок, не огорчайтесь: огорчение истощает силы, предназначенные для исправления недостатков.
7. Простите все самому ненавистному вам человеку, отвлекитесь от самой большой проблемы — вы избавитесь от основной причины, мешающей вашему выздоровлению. ....
8. Не потакайте своей непримиримости, высокомерию, предвзятости, желанию постоянно оправдаться, обмануть, жадности — эти проявления неправильного воспитания являются причиной многих болезней.
9. Непреклонно и твердо пресекайте всяческие попытки втянуть вас в спор, конфликт, сплетни.
10. Не убеждайте того, кто не хочет вас слушать: пострадаете и вы, и собеседник.
11. Вы никогда не ошибетесь, если будете верить людям, будете искренни: правдивое, честное отношение к лицемеру, обманщику является лучшим оружием против него.
12. Когда болеют ваши близкие, родственники, не ходите в расстроенных чувствах — вы этим делаете им еще хуже. Не идите на поводу у своей печали, улыбнитесь больному, заговорите об интересном и радостном — это и есть лучшая помощь.
13. Имейте смелость отказаться от предрассудков.
14. Не впадайте в меланхолию, апатию, не предавайтесь безделью.
15. Полноценный отдых не предполагает полной беззаботности, а является моментом накопления сил для предстоящих дел.
16. Меньше думайте о болезнях, больше о здоровье; не ищите неприятностей вокруг себя: кто ищет — тот находит.
+40 |
47 |
Фрагменты |
+30 |
57 |
тот_самый_Петрович |
+19 |
40 |
история интерьера |
+1 |
17 |
промо радио |
+1 |
27 |
Новости сайта RocketsMusic.ru |
-17 |
20 |
Радио ФМ Онлайн слушать бесплатно |
-24 |
2 |
Лучинин.net |
|
|
|
|
|
|
|
|
|
Загрузка...
взяты из открытых общедоступных источников и являются собственностью их авторов.