Учебная работа № 1966. Курсовая Работа Аппроксимация функций
Министерство образования Российской Федерации
СанктПетербургский государственный горный институт им. Г.В. Плеханова
(технический университет)
КУРСОВАЯ РАБОТА
По дисциплине ИНФОРМАТИКА
(наименование учебной дисциплины согласно учебному плану)
ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
Тема: Аппроксимация функций методом наименьших квадратов
Автор: студент гр. ИЗ991 /________________/ Брук Б.М. (подпись) (Ф.И.О.)
ОЦЕНКА: _____________
Дата: ___________________
ПРОВЕРИЛ
Руководитель проекта ст. преподаватель /________________/ Быкова Е.В.
(должность) (подпись) (Ф.И.О.)
СанктПетербург
2000 год
Министерство образования Российской Федерации СанктПетербургский государственный горный институт им. Г.В. Плеханова (технический университет) |
|
УТВЕРЖДАЮ Заведующий кафедрой /______________/ доц. /Прудинский Г.А./ «___»__________2000 г. |
Кафедра Информатики и компьютерных технологий
КУРСОВАЯ РАБОТА
По дисциплине ИНФОРМАТИКА
(наименование учебной дисциплины согласно учебному плану)
ЗАДАНИЕ
Студенту группы ИЗ991 Брук Б.М.
(шифр группы) (Ф.И.О.)
1. Тема проекта: Использование информационных технологий для решения прикладных задач на примере построения аппроксимации функции методом наименьших квадратов.
2. Исходные данные к проекту: Вариант №22, Задана таблица значений двух наблюдаемых переменных «X» и «Y».
3. Содержание пояснительной записки: Пояснительная записка включает в себя задание на выполнение работы, титульный лист, аннотацию, , введение, собственно тест пояснительной записки, выводы, библиографический список.
4. Перечень графического материала: Представление результатов в виде графиков, блоксхема.
5. Срок сдачи законченного проекта: 1.12.00
Руководитель проекта ст. преподаватель /_______________/ Быкова Е.В. (должность) (подпись) (Ф.И.О.)
Дата выдачи задания: 7.09.00
СанктПетербург
2000 год
Аннотация.
Пояснительная записка представляет собой отчет о выполнении курсовой работы. В ней рассматриваются вопросы по получению эмпирических формул методом наименьших квадратов (МНК). Расчеты проведены средствами пакета Microsoft Excel, в Turbo Pascal 7.0.
Страниц 32, таблиц 8, рис.5.
The Summary
The explanatory note presents a report: in which we discuss questions of the construction of the empirical formulas using method of the least squares in Microsoft Excel. Also this task is presented in Turbo Pascal 7.0.
Pages 32, tables 8, pic.5.
.
. 4
1. Постановка задачи. 6
2. Расчетные формулы. 7
2.1 Построение эмпирических формул методом наименьших квадратов. 7
2.2 Линеаризация экспоненциальной зависимости. 9
2.3 Элементы теории корреляции. 10
3. Расчет коэффициентов аппроксимации в Microsoft Excel. 13
4. Построение графиков в Excel и использование функции ЛИНЕЙН. 21
5. Программа на языке Pascal. 24
5.1. Блоксхема. 24
5.2. Результаты расчета Pascal. 29
Заключение. 30
Список литературы. 31
.
Аппроксимация (от латинского «approximate» «приближаться») приближенное выражение какихлибо математических объектов (например, чисел или функций) через другие более простые, более удобные в пользовании или просто более известные. В научных исследованиях аппроксимация применяется для описания, анализа, обобщения и дальнейшего использования эмпирических результатов.
Как известно, между величинами может существовать точная (функциональная) связь, когда одному значению аргумента соответствует одно определенное значение, и менее точная (корреляционная) связь, когда одному конкретному значению аргумента соответствует приближенное значение или некоторое множество значений функции, в той или иной степени близких друг к другу. При ведении научных исследований, обработке результатов наблюдения или эксперимента обычно приходиться сталкиваться со вторым вариантом. При изучении количественных зависимостей различных показателей, значения которых определяются эмпирически, как правило, имеется некоторая их вариабельность. Частично она задается неоднородностью самих изучаемых объектов неживой и, особенно, живой природы, частично обуславливается погрешностью наблюдения и количественной обработке материалов. Последнюю составляющую не всегда удается исключить полностью, можно лишь минимизировать ее тщательным выбором адекватного метода исследования и аккуратностью работы. Поэтому при выполнении любой научноисследовательской работы возникает проблема выявления подлинного характера зависимости изучаемых показателей, этой или иной степени замаскированных неучтенностью вариабельности значений. Для этого и применяется аппроксимация приближенное описание корреляционной зависимости переменных подходящим уравнением функциональной зависимости, передающим основную тенденцию зависимости (или ее «тренд»).
При выборе аппроксимации следует исходить из конкретной задачи исследования. Обычно, чем более простое уравнение используется для аппроксимации, тем более приблизительно получаемое описание зависимости. Поэтому важно считывать, насколько существенны и чем обусловлены отклонения конкретных значений от получаемого тренда. При описании зависимости эмпирически определенных значений можно добиться и гораздо большей точности, используя какоелибо более сложное, много параметрическое уравнение. Однако нет никакого смысла стремиться с максимальной точностью передать случайные отклонения величин в конкретных рядах эмпирических данных. Гораздо важнее уловить общую закономерность, которая в данном случае наиболее логично и с приемлемой точностью выражается именно двухпараметрическим уравнением степенной функции. Таким образом, выбирая метод аппроксимации, исследователь всегда идет на компромисс: решает, в какой степени в данном случае целесообразно и уместно «пожертвовать» деталями и, соответственно, насколько обобщенно следует выразить зависимость сопоставляемых переменных. Наряду с выявлением закономерностей, замаскированных случайными отклонениями эмпирических данных от общей закономерности, аппроксимация позволяет также решать много других важных задач: формализовать найденную зависимость; найти неизвестные значения зависимой переменной путем интерполяции или, если это допустимо, экстраполяции.
1. Постановка задачи.
Во всех вариантах требуется:
1. Используя метод наименьших квадратов функцию , заданную таблично, аппроксимировать
а) многочленом первой степени ;
б) многочленом второй степени ;
в) экспоненциальной зависимостью .
2. Для каждой зависимости вычислить коэффициент детерминированности.
3. Вычислить коэффициент корреляции (только в случае а).
4. Для каждой зависимости построить линию тренда.
5. Используя функцию ЛИНЕЙН вычислить числовые характеристики зависимости y от x .
6. Сравнить свои вычисления с результатами, полученными при помощи функции ЛИНЕЙН.
7. Сделать вывод, какая из полученных формул наилучшим образом аппроксимирует функцию .
8. Написать программу на одном из языков программирования и сравнить результаты счета с полученными выше.
2. Расчетные формулы.
2.1 Построение эмпирических формул методом наименьших квадратов
Очень часто, особенно при анализе эмпирических данных возникает необходимость найти в явном виде функциональную зависимость между величинами x и y , которые получены в результате измерений.
При аналитическом исследовании взаимосвязи между двумя величинами x и y производят ряд наблюдений и в результате получается таблица значений:
x |
¼ |
¼ |
y |
¼ |
¼ |
Эта таблица обычно получается как итог какихлибо экспериментов, в которых (независимая величина) задается экспериментатором, а получается в результате опыта. Поэтому эти значения будем называть эмпирическими или опытными значениями.
Между величинами x и y существует функциональная зависимость, но ее аналитический вид обычно неизвестен, поэтому возникает практически важная задача найти эмпирическую формулу
(2.1.1)
(где параметры), значения которой при возможно мало отличались бы от опытных значений .
Обычно указывают класс функций (например, множество линейных, степенных, показательных и т.п.) из которого выбирается функция , и далее определяются наилучшие значения параметров.
Если в эмпирическую формулу (2.1.1) подставить исходные , то получим теоретические значения , где .
Разности называются отклонениями и представляют собой расстояния по вертикали от точек до графика эмпирической функции.
Согласно методу наименьших квадратов наилучшими коэффициентами считаются те, для которых сумма квадратов отклонений найденной эмпирической функции от заданных значений функции
(2.1.2)
будет минимальной.
Поясним геометрический смысл метода наименьших квадралтов.
Каждая пара чисел из исходной таблицы определяет точку на плоскости . Используя формулу (2.1.1) при различных значениях коэффициентов можно построить ряд кривых, которые являются графиками функции (2.1.1). Задача состоит в определении коэффициентов таким образом, чтобы сумма квадратов расстояний по вертикали от точек до графика функции (2.1.1) была наименьшей.
Построение эмпирической формулы состоит из двух этапов: выяснение общего вида этой формулы и определение ее наилучших параметров.
Если неизвестен характер зависимости между данными величинами x и y , то вид эмпирической зависимости является произвольным. Предпочтение отдается простым формулам, обладающим хорошей точностью. Удачный выбор эмпирической формулы в значительной мере зависит от знаний исследователя в предметной области, используя которые он может указать класс функций из теоретических соображений. Большое значение имеет изображение полученных данных в декартовых или в специальных системах координат (полулогарифмической, логарифмической и т.д.). По положению точек можно примерно угадать общий вид зависимости путем установления сходства между построенным графиком и образцами известных кривых.
Определение наилучших коэффициентов входящих в эмпирическую формулу производят хорошо известными аналитическими методами.
Для того, чтобы найти набор коэффициентов , которые доставляют минимум функции S , определяемой формулой (2.1.2), используем необходимое условие экстремума функции нескольких переменных равенство нулю частных производных. В результате получим нормальную систему для определения коэффициентов :
(2.1.3)
Таким образом, нахождение коэффициентов сводится к решению системы (2.1.3).
Эта система упрощается, если эмпирическая формула (2.1.1) линейна относительно параметров , тогда система (2.1.3) будет линейной.
Конкретный вид системы (2.1.3) зависит от того, из какого класса эмпирических формул мы ищем зависимость (2.1.1). В случае линейной зависимости система (2.1.3) примет вид:
(2.1.4)
Эта линейная система может быть решена любым известным методом (методом Гаусса, простых итераций, формулами Крамера).
В случае квадратичной зависимости система (2.1.3) примет вид:
(2.1.5)
2.2 Линеаризация экспоненциальной зависимости.
В ряде случаев в качестве эмпирической формулы берут функцию в которую неопределенные коэффициенты входят нелинейно. При этом иногда задачу удается линеаризовать, т.е. свести к линейной. К числу таких зависимостей относится экспоненциальная зависимость
(2.2.1)
где и неопределенные коэффициенты.
Линеаризация достигается путем логарифмирования равенства (2.2.1), после чего получаем соотношение
(2.2.2)
Обозначим и соответственно через и , тогда зависимость (2.2.1) может быть записана в виде , что позволяет применить формулы (2.1.4) с заменой на и на .
2.3 Элементы теории корреляции.
График восстановленной функциональной зависимости по результатам измерений называется кривой регрессии. Для проверки согласия построенной кривой регрессии с результатами эксперимента обычно вводят следующие числовые характеристики: коэффициент корреляции (линейная зависимость), корреляционное отношение и коэффициент детерминированности. При этом результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке этой таблицы приводятся численности тех пар , компоненты которых попадают в соответствующие интервалы группировки по каждой переменной. Предполагая длины интервалов группировки (по каждой переменной) равными между собой, выбирают центры (соответственно ) этих интервалов и числа в качестве основы для расчетов.
Коэффициент корреляции является мерой линейной связи между зависимыми случайными величинами: он показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.
Коэффициент корреляции вычисляется по формуле:
, (2.3.1)
где , и ¾ среднее арифметическое значение соответственно по x и y.
Коэффициент корреляции между случайными величинами по абсолютной величине не превосходит 1. Чем ближе к 1, тем теснее линейная связь между x и y.
В случае нелинейной корреляционной связи условные средние значения располагаются около кривой линии. В этом случае в качестве характеристики силы связи рекомендуется использовать корреляционное отношение, интерпретация которого не зависит от вида исследуемой зависимости.
Корреляционное отношение вычисляется по формуле:
, (2.3.2)
где , а числитель характеризует рассеяние условных ср