Химическая информация
в паутине российской сети Internet
В.В.Лунин, М.Я.Мельников, Б.И.Покровский,
А.И.Лебедев, М.М.Табунов,
Э.К.Кочетова, И.В.Петросян
Московский государственный университет им.М.В.Ломоносова
Наука производит и потребляет огромное количество информации. Химия
по своему информационному наполнению значительно опережает большинство
других естественнонаучных дисциплин. Закономерно, что именно химики неоднократно
были инициаторами появления новых подходов к проблемам научной информации.
О том, как сегодня идет освоение возможностей “новой технологии” на химическом
факультете МГУ, и рассказывается ниже.
К тому времени в стране работы в этом направлении уже были начаты. В 1983 г. в ВИНИТИ создана крупнейшая в Советском Союзе электронная информационная система. В ее базах содержалась библиографическая информация практически по всем разделам естественных наук, что соответствовало выпускам “Реферативного журнала”. Система предназначалась для работы в режиме удаленного доступа. Научному сотруднику уже не требовалось непременно находиться рядом с источником информации, а можно было вести поиск из любого другого места, имея компьютер, телефон и модем. Другим важным информационным центром был Международный центр научной и технической информации. На компьютерах МЦНТИ был установлен ряд зарубежных и отечественных баз данных, в том числе INSPEC (Physics Abstracts), INIS (международная база по ядерным физике и технологии) и несколько других. Существовал еще и ряд специализированных систем. Так, система “Поиск” содержала материалы международной патентной службы INPADOC; сведения об отчетах и диссертациях хранились в базе ВНТИЦентра, в крупнейшей научной библиотеке ГПНТБ был образован компьютерный центр. К сожалению, все эти центры располагали несовершенной технологической базой и реального значения не имели. Доступ к зарубежным информационным системам в то время был возможен через Всесоюзный институт прикладных автоматизированных систем. Однако эту возможность использовали крайне редко из-за отсутствия валютных средств. На первом этапе технология работы с удаленными базами данных была еще несовершенна. Использовались отечественные модемы весом более 20 кг, передающие информацию со скоростью 300 бит/с. Сами системы функционировали на машинах типа ЕС, где часто происходили сбои, в результате чего сеансы связи порой превращались в весьма нервные мероприятия. Несмотря на это, использование телекоммуникации оказалось исключительно эффективным. Например, скорость и полнота поиска в реферативных базах ВИНИТИ и МЦНТИ была несравнимо выше, чем позволяли традиционные библиотечные методы. Таким образом, в середине 80-х годов в России начала формироваться инфраструктура информационного обеспечения, основанная на телекоммуникационной технологии. Все это надо было освоить и ввести в практику. Научным сотрудникам и студентам следовало не только предоставить возможность использовать такие системы, но и научить ими пользоваться. С этой целью на химическом факультете МГУ в 1986 г. был создан Информационный центр, где в режиме удаленного доступа шла работа с крупными поставщиками информационных услуг (ВИНИТИ, МЦНТИ, ГПНТБ и др.). Были изданы два справочных руководства по работе с информационно-поисковыми системами: В.М.Потапова и Э.К.Кочетовой “Химическая информация” (1988) и В.М.Потапова, М.И.Розенмана, Э.К.Кочетовой и Б.И.Покровского “Поиск химической информации” (1990). Постепенно работа с компьютерными источниками информации становится все более привычным явлением: в Информационный центр приходят сотрудники, аспиранты, дипломники, там читаются лекции, проводятся семинары и консультации. Опыт начали перенимать коллеги из других химических вузов, в том числе из РХТУ им. Д.И.Менделеева. Все оборвалось в 1992 г. Не стало средств для эксплуатации больших ЭВМ класса ЕС. На этом завершился первый этап использования телекоммуникации в информационном обеспечении науки и образования в России. Какие же выводы были сделаны? Сейчас реально построить эффективную информационную инфраструктуру можно, взяв за основу телекоммуникационную технологию. Во-вторых, проблему химической информации химики должны решать самостоятельно. Действительно, как показывает опыт, трудно рассчитывать, что кто-либо лучше их самих сможет учесть в информационно-поисковых системах такие специфические особенности химических публикаций, как номенклатура органических и комплексных соединений, структурные формулы и пр. В этом нет ничего особенного. Так, крупнейший реферативный журнал по химии “Chemical Abstracts” издается в США не в недрах некоего информационного монстра, а под эгидой Американского химического общества. |
Новый этап в создании инфраструктуры информационного обеспечения научных
исследований в химии начался в 1994 г., когда соответствующий проект был
поддержан Российским фондом фундаментальных исследований (РФФИ). Задача
формулировалась просто: “...создание на химическом факультете МГУ информационной
сети, базирующейся на компьютерной технологии и средствах телекоммуникации.
Сеть должна обеспечить технические возможности свободного интерактивного
доступа как к внешним, так и факультетским информационным источникам...”
Проект задумывался с целью образовать общероссийскую сеть, назначение которой
— интегрировать информационные ресурсы в области химии и создавать условия
для их эффективного использования не только в столичных, но и региональных
научных и образовательных центрах.
Мировая информационная инфраструктура строится из двух главных компонент. Первая — это среда передачи информации в виде глобальной сети Internet. Вторая — компьютеры, на которых в форме баз данных размещаются информационные ресурсы. Таким образом, чтобы обеспечить связь с удаленными источниками информации, надо прежде всего создать локальную сеть факультета и обеспечить через нее выход в Internet. Первые компьютеры были подключены к сети Internet в начале 1994 г., а к середине 1996 г. она объединяла уже около 200 компьютеров различных учебных и научных лабораторий. Доступ к информации был построен с использованием возможностей WWW-сервера. |
Организация сети — это лишь малая часть в создании инфраструктуры. Более
существенный момент — те информационные ресурсы, передачу которых эта среда
должна обслуживать. Поэтому задачей второго этапа проекта было “установить
на сервере Информационного центра химического факультета МГУ блок наиболее
актуальных отечественных и зарубежных компьютерных баз данных на CD-ROM
и других машиночитаемых носителях, обеспечив к ним доступ через Internet”.
Иными словами, основные усилия теперь направлялись на создание информационных
ресурсов и организацию работы с ними.
Одной из повседневных обязанностей современного химика стала работа с научной литературой. Для того чтобы сделать ее более эффективной, надо было обратиться к компьютерным поисковым системам. С этой целью в читальном зале библиотеки факультета установили компьютеры, используя которые читатели теперь могли работать с базами данных удаленных отечественных и зарубежных информационных систем, а также с базами на CD-ROM. В первую очередь речь идет о библиографических базах данных, которые создаются в результате непрерывного сканирования общемирового потока научной литературы. При отсутствии доступа к таким базам возрастает вероятность вовремя не заметить важное сообщение. Такая ситуация особенно актуальна в период информационного бума, связанного с крупным открытием, подобного тому, какой наблюдался в 1986 г., сразу после обнаружения высокотемпературной сверхпроводимости. Наиболее авторитетным реферативно-библиографическим изданием в области химии, бесспорно, является журнал “Chemical Abstracts”, издающийся Американским химическим обществом с 1907 г. В семидесятых годах стала создаваться компьютерная версия журнала, которая включает практически все сведения о публикациях в области химии и химической технологии начиная с 1967 г. Поиск информации в ней возможен по имени автора, названиям журналов и книг, химических соединений, по структурным формулам химических соединений, ключевым словам и др. В результате поиска выдается подробная библиографическая информация, включая реферат публикации. В базе содержатся сведения о статьях из более чем 8 тыс. журналов и других источников. В настоящее время в “Chemical Abstracts” зарегистрировано более 18 млн химических соединений. Юбилейное соединение было зарегистрировано 15 июня 1998 г. На химическом факультете работа с базой “Chemical Abstracts” в режиме удаленного доступа через Internet была налажена в 1994 г., причем МГУ, как и университетам всего мира, предоставили льготный режим оплаты информационных услуг. С 1996 г. читателям библиотеки факультета доступна версия “Chemical Abstracts” на CD-ROM за 1996—1998 гг. Она установлена на компьютере Информационного центра и не требует дополнительных финансовых затрат. Другой исключительно полезной и доступной базой данных стала INSPEC. Она создается в Англии Обществом инженеров-электриков и является полным аналогом реферативных журналов “Physics Abstracts”, “Computer and Control Abstracts”. INSPEC одна из уникальных международных баз, где собрана информация физико-математического профиля. В ней реферируется свыше 4200 журналов по физике, физической химии и др. Поиск можно проводить по ключевым словам, указателю числовых данных, названию химических соединений, по имени автора и др. В результате выдается документ с полным библиографическим описанием и большим рефератом. Информационный центр имеет полный комплект баз данных INSPEC, выпущенных на CD-ROM за 1989—1998 гг. Следующим значительным источником информации по-прежнему остается ВИНИТИ. Из библиотеки через Internet возможна работа с базами “Химия”, “Физика”, “Обзоры”, “Металлургия” и др. База “Химия” содержит свыше 3.5 млн документов и ежегодно пополняется примерно на 150 тыс. Поиск возможен по ключевым словам, названиям соединений, по авторам, названиям журналов, заголовкам публикаций. Результат представляет собой библиографическое описание публикации на русском языке; в последние годы в документе присутствует реферат. Понимание механизма химических процессов и синтез новых материалов невозможны без привлечения структурной информации. Поэтому следующей по значимости и востребованности является информация о структурах органических и неорганических соединений. Она представлена в двух базах на CD-ROM. Это, во-первых, база “Inorganic Crystal Structure Database”, выпускаемая Институтом неорганической химии Гмелина. В ней содержатся описания кристаллических структур неорганических веществ, сведения о которых публиковались с 1915 г. Благодаря графическим программам возможен просмотр структур в различных ракурсах. Вторая база — “Cambridge Structural Database System” (“Кристаллические структуры органических соединений”) содержит информацию о структурах более 160 тыс. органических соединений. Ее дополняет база по структурам белков “Brookhaven Protein Data Bank”. В коллекции баз на CD-ROM есть и еще ряд специализированных изданий, в том числе “Stability Constants Database” (“Константы устойчивости комплексных соединений”) и др. |
Зарубежным ресурсам посвящен специальный раздел. Из него можно узнать, на каком WWW-сервере в общемировой “паутине” находятся сведения о химических научных центрах и журналах, базах информации, международных конференциях, различных электронных изданиях и другие материалы. Каждая ссылка сопровождается небольшим комментарием на русском языке. Информация на серверах зарубежных научных учреждений чаще всего носит презентационный и рекламный характер. Доступ к полноценной информации, как правило, является коммерческим и достаточно дорогим. Правда, есть ряд некоммерческих серверов, содержащих фундаментальную научную информацию, которой пока нет в российских общедоступных базах данных. К примеру, на сервере Национального института стандартов и технологий США (NIST) (http://webbook.nist.gov) размещена база данных “NIST Chemistry Webbook”, в которую включены подвергнутые экспертной оценке данные: термодинамические для органических и неорганических соединений, инфракрасные спектры, масс-спектры, электронно-колебательные спектры и другие данные для многих тысяч индивидуальных соединений. Интересующие соединения можно искать по названию, химической формуле и ряду других числовых свойств. Нельзя не обратить внимание на возможность доступа к информационной системе “Beilstein NetFire” (http://www.beilstein.com/netfire/netfire.html), которая создается Институтом Бейльштейна. Она содержит рефераты публикаций по химии более ста научных журналов. В настоящее время доступны рефераты за 1980—1996 гг., где можно проводить гибкий поиск по автору, словам из заголовка статьи или реферата. Хорошим источником информации для биохимиков стала база “Medline” (http://www.ncbi.nlm.nih.gov/Entrez/medline.html) Национальной медицинской библиотеки США. В разделе, посвященном отечественным базам данных, приводятся подробные описания каждой из них, даются примеры документов и сообщаются сведения об авторах. Это — большей частью базы, специализированные по конкретным разделам химии (по неорганическим материалам, пестицидам и др.). К ним, как правило, нет доступа по сети, но это не снижает ценности собранной в них информации. В этот же раздел включено несколько установленных на сервере интерактивных баз, созданных на факультете. В их число входит и каталог библиотеки химического факультета МГУ, в котором приводятся сведения о 255 иностранных и 180 отечественных журналах (с указанием по годам, по отдельным номерам и выпускам, по страницам). |
Пока слабым местом в этой структуре остаются информационные ресурсы. Большинство отечественных научных баз данных реально может использоваться только самими авторами. Поэтому назрела необходимость перейти от разрозненного набора информации к созданию в российском секторе Internet согласованной системы ресурсов с перспективой, чтобы каждая из входящих в эту систему баз данных по своему уровню соответствовала бы определенным критериям качества как по содержанию, так и набору сервисных показателей. Формирование российских ресурсов по химии следует согласовать с учетом первоочередных потребностей и реальных материальных возможностей. Начало такой работе положено. Академические институты Москвы и Новосибирска совместно с Московским и Санкт-Петербургским университетами уже приступили к работе в этом направлении в рамках общего проекта РФФИ. Важным информационным ресурсом должны стать электронные справочные издания, содержащие фактографические данные о фундаментальных свойствах веществ (структуре, термодинамических параметрах и др.). В первую очередь речь идет о создании электронных версий таких изданий, как “Термодинамические свойства веществ” в 10 томах под редакцией академика В.П.Глушко. Наличие в этих версиях поискового аппарата и набора программных средств для обработки данных позволит использовать их не только в научной работе, но и в образовательных целях, значительно расширив при этом диапазон и сложность учебных задач, перейдя от простых модельных ситуаций к уровню научного исследования. На виртуальных “полках” академических и университетских библиотек наряду со справочниками должна присутствовать отечественная и зарубежная научная периодика. Только через технологию электронной библиотеки можно будет обеспечить полностью все научные и образовательные организации России этими информационными материалами. И здесь есть первые успехи. Так, по сети стали доступны электронные копии журналов, научные редакции которых находятся в Физико-техническом институте им. А.Ф.Иоффе (http://www.ioffe.rssi.ru/journals). Это — “Физика твердого тела”, “Физика полупроводников” и др. Развитие науки, как уже отмечалось, идет стремительными темпами. К примеру, в ряде направлений биохимии сегодня информация годичной давности считается уже устаревшей. Важно не только вовремя получить информацию, но и сообщить научной общественности о результатах своих исследований. В этой связи для ускорения публикации эффективным может быть создание в сети Internet отечественных электронных химических журналов или соответствующих приложений к печатным изданиям, как это, к примеру, организуется в Германии издательством “Springer”. Публикации в электронных изданиях должны соответствовать тем же требованиям и правилам, что и в печатных — как по содержанию, так и по соблюдению авторских прав. Только в этом случае статьи в сети Internet станут обладать в глазах научной общественности равными правами с журнальными аналогами. В качестве удачного примера начала такой работы в России можно привести выпуск Алтайским университетом электронного журнала “Химия растительного сырья” (http://www.dcn-asu.ru/journals). Перечисленные задачи — только часть той большой работы, которую требуется
и далее систематически проводить, чтобы создать эффективную информационную
инфраструктуру, способную обеспечить потребности науки и образования в
России.
Работа выполнена при финансовой поддержке РФФИ. Грант 98-07-90122. |