![]() |
|
|
Учебное пособие: Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белковМетод "выбора переменных" [7]. Обычный метод наименьших квадратов, используемый для представления произвольного спектра КД в виде линейной комбинации базисных спектров, имеет по сравнению с другими методами наибольшую гибкость. Это проявляется в том, что спектры базисных белков участвуют в разложении в различной степени в зависимости от характера конкретного спектра. Однако, эксперименты показывают, что наилучшее воспроизведение формы спектра не всегда дает лучшие результаты. Более того, метод наименьших квадратов оказывается неустойчивым к экспериментальной ошибке, если число используемых в разложении базисных спектров превышает информационное содержание анализируемого спектра (для спектров в диапазоне 178-260 нм оно приблизительно равно пяти, а в диапазоне 190-260 нм - четырем). Метод "регуляризации" [4] решает эту проблему с помощью "регуляризатора", который стабилизирует систему, оставляя ей при этом значительную гибкость. Метод "ортогональных спектров" [5,6] достигает устойчивости метода наименьших квадратов за счет использования только пяти ортогональных базисных спектров, построенных на основе исходного набора спектров базисных белков. Однако, поскольку базисные спектры построены на основе фиксированного набора спектров базисных белков, степень участия последних при воспроизведении анализируемого спектра также оказывается в некоторой мере фиксированной, а гибкость метода - крайне низкой. Метод "выбора переменных", суть которого будет описана ниже, основан на методе "ортогональных спектров", но обладает значительной гибкостью, достигаемой за счет использования при построении ортогональных базисных спектров различных наборов базисных белков, выбираемых с помощью статистической процедуры "выбора переменных". Рассмотрим смысл этой процедуры более подробно. Предсказание вторичной структуры белка по его спектру КД должно удовлетворять двум важным условиям: 1.
Величины содержания в белке рассматриваемых структурных элементов не должны
быть отрицательными: 2.
Суммарное содержание в белке всех рассматриваемых типов структур должно быть
равно единице (100%): Второе условие является особенно важным при анализе конформационных
изменений белка при денатурации или связывании каких-либо лигандов. Во всех методах,
описанных выше, оба эти условия вводятся непосредственно в процедуру нахождения
коэффициентов Для преодоления подобных недостатков авторы рассматриваемого
метода не пользуются условиями (1) и (2) и допускают существование отрицательных
коэффициентов Поскольку заранее не известно, какие из базисных белков содержат
элементы, отсутствующие у исследуемого белка, и спектры которых необходимо исключить
из исходного набора для улучшения результатов, рассматриваются все возможные комбинации
из исходного набора 16 базисных спектров. Эта процедура выполняется в следующем
порядке. Сначала из исходного набора исключаются поочередно по три базисных спектра
на каждом шаге, а ортогональные базисные спектры строятся на основе оставшихся 13
исходных базисных спектров. Сравнение результатов, полученных для различных наборов
из 13 базисных белков, выявляет один или два белка, которые являлись причиной отклонений
коэффициентов Критериями удовлетворительного решения, соответствующего оптимальному набору базисных спектров, являются следующие условия: 1.
Сумма коэффициентов 2.
Значение содержания произвольной структурной формы в исследуемом белке ( 3. Воспроизведение анализируемого спектра на основе выбранного набора базисных спектров должно быть лучше, чем при использовании полного их набора. 4. Более предпочтительным является набор, содержащий большее число базисных спектров. 5. Более предпочтительными являются те белки, спектры которых ближе к анализируемому спектру. На практике в большинстве случаев удовлетворительных результатов удается достичь при исключении из исходного набора всего трех или четырех белков, причем среднеквадратичная ошибка при воспроизведении анализируемого спектра составляет меньше 0.2 единицы De. Если несколько наборов базисных белков оказываются удовлетворительными в одинаковой степени, то результаты, полученные на их основе, усредняются. В заключение можно отметить, что метод "выбора переменных" является мощным средством анализа спектров КД белков в ситуациях, когда другие распространеннные методы дают заведомо неверные результаты. Сравнение различных методов анализа спектров КД.Поскольку все методы анализа спектров КД имеют чисто эмпирический характер, каждый из них нуждается в экспериментальной проверке на белках с известными рентгеноструктурными данными. Обычно подобная проверка проводится на белках, включенных в базисный набор для данного метода. При этом белки поочередно исключаются по одному из этого набора, а их спектры анализируются на основе спектров оставшихся белков. После этого результаты, полученные для каждого типа вторичной структуры, сравниваются со значениями, полученными при рентгеноструктурном анализе, с помощью подсчета коэффициента корреляции между этими двумя наборами данных, определяемого следующим выражением:
Здесь Ниже приведены значения коэффициентов корреляции для четырех рассмотренных методов: метода "эталонных спектров" [2,3], метода "регуляризации" [4], метода "ортогональных спектров" [5,6] и метода "выбора переменных" [7]:
Пакет программ STRUCTURE разработан в институте белка РАН (1991-1992 К.С. Василенко). Он предназначен для анализа спектров кругового дихроизма белков и определения их вторичной структуры. Алгоритм анализа спектров основан на методах, описанных выше. Пакет STRUCTURE состоит из следующих программ и вспомогательных файлов: - STRUCTURE (файл structur.exe) - программа, обеспечивающая интерфейс для всех программ пакета, позволяющая также создавать и редактировать файлы данных в универсальном для всех программ формате. - CONTIN (файл contin.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4]. - PROVCD (файл provcd.exe) - программа, осуществляющая проведение статистического теста для программы CONTIN. - DEF_CLASS (файл def_clas.exe) - программа, определяющая тип третичной структуры белка. - CDESTIMATE (файл cdestima.exe) - программа, определяющая вторичную структуру белка методом "эталонных спектров" [3]. - VARSELEC (файл varselec.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" с процедурой "выбора переменных" [7]. - RUN.BAT - командный файл, используемый для запуска программ пакета в условиях недостаточного объема оперативной памяти. |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
|
Рефераты бесплатно, реферат бесплатно, сочинения, курсовые работы, реферат, доклады, рефераты, рефераты скачать, рефераты на тему, курсовые, дипломы, научные работы и многое другое. |
||
При использовании материалов - ссылка на сайт обязательна. |