№ 7, 1999 г.
© Авторы

Химическая информация
в паутине российской сети Internet

В.В.Лунин, М.Я.Мельников, Б.И.Покровский,
А.И.Лебедев, М.М.Табунов,
Э.К.Кочетова, И.В.Петросян
Московский государственный университет им.М.В.Ломоносова


 
Неинформированность сразу означает отставание.
Джеймс Уотсон,
нобелевский лауреат

 
Наука производит и потребляет огромное количество информации. Химия по своему информационному наполнению значительно опережает большинство других естественнонаучных дисциплин. Закономерно, что именно химики неоднократно были инициаторами появления новых подходов к проблемам научной информации. О том, как сегодня идет освоение возможностей “новой технологии” на химическом факультете МГУ, и рассказывается ниже. Первый этап освоения телекоммуникации Наше знакомство с телекоммуникацией произошло в 1985 г., когда один из сотрудников Института высоких температур РАН принес простенький модем американского производства и продемонстрировал, как можно по телефону соединиться с удаленным компьютером и получить информацию из базы термодинамических данных Ивтантермо. Это сразу привлекло наше внимание. Стало очевидно, что этот путь позволит совершенно по-новому организовать работу с научной информацией.

К тому времени в стране работы в этом направлении уже были начаты. В 1983 г. в ВИНИТИ создана крупнейшая в Советском Союзе электронная информационная система. В ее базах содержалась библиографическая информация практически по всем разделам естественных наук, что соответствовало выпускам “Реферативного журнала”. Система предназначалась для работы в режиме удаленного доступа. Научному сотруднику уже не требовалось непременно находиться рядом с источником информации, а можно было вести поиск из любого другого места, имея компьютер, телефон и модем.

Другим важным информационным центром был Международный центр научной и технической информации. На компьютерах МЦНТИ был установлен ряд зарубежных и отечественных баз данных, в том числе INSPEC (Physics Abstracts), INIS (международная база по ядерным физике и технологии) и несколько других.

Существовал еще и ряд специализированных систем. Так, система “Поиск” содержала материалы международной патентной службы INPADOC; сведения об отчетах и диссертациях хранились в базе ВНТИЦентра, в крупнейшей научной библиотеке ГПНТБ был образован компьютерный центр. К сожалению, все эти центры располагали несовершенной технологической базой и реального значения не имели.

Доступ к зарубежным информационным системам в то время был возможен через Всесоюзный институт прикладных автоматизированных систем. Однако эту возможность использовали крайне редко из-за отсутствия валютных средств.

На первом этапе технология работы с удаленными базами данных была еще несовершенна. Использовались отечественные модемы весом более 20 кг, передающие информацию со скоростью 300 бит/с. Сами системы функционировали на машинах типа ЕС, где часто происходили сбои, в результате чего сеансы связи порой превращались в весьма нервные мероприятия. Несмотря на это, использование телекоммуникации оказалось исключительно эффективным. Например, скорость и полнота поиска в реферативных базах ВИНИТИ и МЦНТИ была несравнимо выше, чем позволяли традиционные библиотечные методы.

Таким образом, в середине 80-х годов в России начала формироваться инфраструктура информационного обеспечения, основанная на телекоммуникационной технологии. Все это надо было освоить и ввести в практику. Научным сотрудникам и студентам следовало не только предоставить возможность использовать такие системы, но и научить ими пользоваться.

С этой целью на химическом факультете МГУ в 1986 г. был создан Информационный центр, где в режиме удаленного доступа шла работа с крупными поставщиками информационных услуг (ВИНИТИ, МЦНТИ, ГПНТБ и др.). Были изданы два справочных руководства по работе с информационно-поисковыми системами: В.М.Потапова и Э.К.Кочетовой “Химическая информация” (1988) и В.М.Потапова, М.И.Розенмана, Э.К.Кочетовой и Б.И.Покровского “Поиск химической информации” (1990).

Постепенно работа с компьютерными источниками информации становится все более привычным явлением: в Информационный центр приходят сотрудники, аспиранты, дипломники, там читаются лекции, проводятся семинары и консультации. Опыт начали перенимать коллеги из других химических вузов, в том числе из РХТУ им. Д.И.Менделеева.

Все оборвалось в 1992 г. Не стало средств для эксплуатации больших ЭВМ класса ЕС. На этом завершился первый этап использования телекоммуникации в информационном обеспечении науки и образования в России.

Какие же выводы были сделаны?

Сейчас реально построить эффективную информационную инфраструктуру можно, взяв за основу телекоммуникационную технологию. Во-вторых, проблему химической информации химики должны решать самостоятельно. Действительно, как показывает опыт, трудно рассчитывать, что кто-либо лучше их самих сможет учесть в информационно-поисковых системах такие специфические особенности химических публикаций, как номенклатура органических и комплексных соединений, структурные формулы и пр. В этом нет ничего особенного. Так, крупнейший реферативный журнал по химии “Chemical Abstracts” издается в США не в недрах некоего информационного монстра, а под эгидой Американского химического общества.

.
Проект РФФИ. Компьютерная сеть факультета
Новый этап в создании инфраструктуры информационного обеспечения научных исследований в химии начался в 1994 г., когда соответствующий проект был поддержан Российским фондом фундаментальных исследований (РФФИ). Задача формулировалась просто: “...создание на химическом факультете МГУ информационной сети, базирующейся на компьютерной технологии и средствах телекоммуникации. Сеть должна обеспечить технические возможности свободного интерактивного доступа как к внешним, так и факультетским информационным источникам...” Проект задумывался с целью образовать общероссийскую сеть, назначение которой — интегрировать информационные ресурсы в области химии и создавать условия для их эффективного использования не только в столичных, но и региональных научных и образовательных центрах.

Мировая информационная инфраструктура строится из двух главных компонент. Первая — это среда передачи информации в виде глобальной сети Internet. Вторая — компьютеры, на которых в форме баз данных размещаются информационные ресурсы. Таким образом, чтобы обеспечить связь с удаленными источниками информации, надо прежде всего создать локальную сеть факультета и обеспечить через нее выход в Internet.

Первые компьютеры были подключены к сети Internet в начале 1994 г., а к середине 1996 г. она объединяла уже около 200 компьютеров различных учебных и научных лабораторий. Доступ к информации был построен с использованием возможностей WWW-сервера.

.
Информационный центр факультета. Библиотека баз данных
Организация сети — это лишь малая часть в создании инфраструктуры. Более существенный момент — те информационные ресурсы, передачу которых эта среда должна обслуживать. Поэтому задачей второго этапа проекта было “установить на сервере Информационного центра химического факультета МГУ блок наиболее актуальных отечественных и зарубежных компьютерных баз данных на CD-ROM и других машиночитаемых носителях, обеспечив к ним доступ через Internet”. Иными словами, основные усилия теперь направлялись на создание информационных ресурсов и организацию работы с ними.

Одной из повседневных обязанностей современного химика стала работа с научной литературой. Для того чтобы сделать ее более эффективной, надо было обратиться к компьютерным поисковым системам. С этой целью в читальном зале библиотеки факультета установили компьютеры, используя которые читатели теперь могли работать с базами данных удаленных отечественных и зарубежных информационных систем, а также с базами на CD-ROM.

В первую очередь речь идет о библиографических базах данных, которые создаются в результате непрерывного сканирования общемирового потока научной литературы. При отсутствии доступа к таким базам возрастает вероятность вовремя не заметить важное сообщение. Такая ситуация особенно актуальна в период информационного бума, связанного с крупным открытием, подобного тому, какой наблюдался в 1986 г., сразу после обнаружения высокотемпературной сверхпроводимости.

Наиболее авторитетным реферативно-библиографическим изданием в области химии, бесспорно, является журнал “Chemical Abstracts”, издающийся Американским химическим обществом с 1907 г. В семидесятых годах стала создаваться компьютерная версия журнала, которая включает практически все сведения о публикациях в области химии и химической технологии начиная с 1967 г. Поиск информации в ней возможен по имени автора, названиям журналов и книг, химических соединений, по структурным формулам химических соединений, ключевым словам и др. В результате поиска выдается подробная библиографическая информация, включая реферат публикации. В базе содержатся сведения о статьях из более чем 8 тыс. журналов и других источников. В настоящее время в “Chemical Abstracts” зарегистрировано более 18 млн химических соединений. Юбилейное соединение было зарегистрировано 15 июня 1998 г.

На химическом факультете работа с базой “Chemical Abstracts” в режиме удаленного доступа через Internet была налажена в 1994 г., причем МГУ, как и университетам всего мира, предоставили льготный режим оплаты информационных услуг. С 1996 г. читателям библиотеки факультета доступна версия “Chemical Abstracts” на CD-ROM за 1996—1998 гг. Она установлена на компьютере Информационного центра и не требует дополнительных финансовых затрат.

Другой исключительно полезной и доступной базой данных стала INSPEC. Она создается в Англии Обществом инженеров-электриков и является полным аналогом реферативных журналов “Physics Abstracts”, “Computer and Control Abstracts”. INSPEC одна из уникальных международных баз, где собрана информация физико-математического профиля. В ней реферируется свыше 4200 журналов по физике, физической химии и др. Поиск можно проводить по ключевым словам, указателю числовых данных, названию химических соединений, по имени автора и др. В результате выдается документ с полным библиографическим описанием и большим рефератом. Информационный центр имеет полный комплект баз данных INSPEC, выпущенных на CD-ROM за 1989—1998 гг.

Следующим значительным источником информации по-прежнему остается ВИНИТИ. Из библиотеки через Internet возможна работа с базами “Химия”, “Физика”, “Обзоры”, “Металлургия” и др. База “Химия” содержит свыше 3.5 млн документов и ежегодно пополняется примерно на 150 тыс. Поиск возможен по ключевым словам, названиям соединений, по авторам, названиям журналов, заголовкам публикаций. Результат представляет собой библиографическое описание публикации на русском языке; в последние годы в документе присутствует реферат.

Понимание механизма химических процессов и синтез новых материалов невозможны без привлечения структурной информации. Поэтому следующей по значимости и востребованности является информация о структурах органических и неорганических соединений. Она представлена в двух базах на CD-ROM. Это, во-первых, база “Inorganic Crystal Structure Database”, выпускаемая Институтом неорганической химии Гмелина. В ней содержатся описания кристаллических структур неорганических веществ, сведения о которых публиковались с 1915 г. Благодаря графическим программам возможен просмотр структур в различных ракурсах. Вторая база — “Cambridge Structural Database System” (“Кристаллические структуры органических соединений”) содержит информацию о структурах более 160 тыс. органических соединений. Ее дополняет база по структурам белков “Brookhaven Protein Data Bank”.

В коллекции баз на CD-ROM есть и еще ряд специализированных изданий, в том числе “Stability Constants Database” (“Константы устойчивости комплексных соединений”) и др.

.
WWW-сервер “Chemnet” В настоящее время наиболее часто для работы в Internet используется технология WWW (World Wide Web). WWW-сервер “Chemnet” (http://www.chem.msu.su/) установлен в сети на компьютере Информационного центра в конце 1994 г. На сервере собрана разнообразная информация о российских и зарубежных электронных ресурсах по химии.

Зарубежным ресурсам посвящен специальный раздел. Из него можно узнать, на каком WWW-сервере в общемировой “паутине” находятся сведения о химических научных центрах и журналах, базах информации, международных конференциях, различных электронных изданиях и другие материалы. Каждая ссылка сопровождается небольшим комментарием на русском языке.

Информация на серверах зарубежных научных учреждений чаще всего носит презентационный и рекламный характер. Доступ к полноценной информации, как правило, является коммерческим и достаточно дорогим. Правда, есть ряд некоммерческих серверов, содержащих фундаментальную научную информацию, которой пока нет в российских общедоступных базах данных.

К примеру, на сервере Национального института стандартов и технологий США (NIST) (http://webbook.nist.gov) размещена база данных “NIST Chemistry Webbook”, в которую включены подвергнутые экспертной оценке данные: термодинамические для органических и неорганических соединений, инфракрасные спектры, масс-спектры, электронно-колебательные спектры и другие данные для многих тысяч индивидуальных соединений. Интересующие соединения можно искать по названию, химической формуле и ряду других числовых свойств.

Нельзя не обратить внимание на возможность доступа к информационной системе “Beilstein NetFire” (http://www.beilstein.com/netfire/netfire.html), которая создается Институтом Бейльштейна. Она содержит рефераты публикаций по химии более ста научных журналов. В настоящее время доступны рефераты за 1980—1996 гг., где можно проводить гибкий поиск по автору, словам из заголовка статьи или реферата.

Хорошим источником информации для биохимиков стала база “Medline” (http://www.ncbi.nlm.nih.gov/Entrez/medline.html) Национальной медицинской библиотеки США.

В разделе, посвященном отечественным базам данных, приводятся подробные описания каждой из них, даются примеры документов и сообщаются сведения об авторах. Это — большей частью базы, специализированные по конкретным разделам химии (по неорганическим материалам, пестицидам и др.). К ним, как правило, нет доступа по сети, но это не снижает ценности собранной в них информации.

В этот же раздел включено несколько установленных на сервере интерактивных баз, созданных на факультете. В их число входит и каталог библиотеки химического факультета МГУ, в котором приводятся сведения о 255 иностранных и 180 отечественных журналах (с указанием по годам, по отдельным номерам и выпускам, по страницам).

Электронная библиотека по химии В последнее время сформировался раздел сервера, где помещаются полные тексты статей и книг. Началось последовательное формирование электронной библиотеки по химии, где представлены журналы “Вестник Московского университета”, “Журнал Российского химического общества”, избранные разделы журналов “Химия и жизнь” и “Химия и бизнес”. Значительное место отведено публикации курсов лекций и другой учебной литературе.
.
Основные итоги и перспективы Итак, при поддержке РФФИ в России формируется эффективная информационная инфраструктура на принципиально новой технологической основе. Наиболее важный результат, по нашему мнению — это возможность для российских ученых систематически работать с базами данных общемирового масштаба.

Пока слабым местом в этой структуре остаются информационные ресурсы. Большинство отечественных научных баз данных реально может использоваться только самими авторами. Поэтому назрела необходимость перейти от разрозненного набора информации к созданию в российском секторе Internet согласованной системы ресурсов с перспективой, чтобы каждая из входящих в эту систему баз данных по своему уровню соответствовала бы определенным критериям качества как по содержанию, так и набору сервисных показателей. Формирование российских ресурсов по химии следует согласовать с учетом первоочередных потребностей и реальных материальных возможностей. Начало такой работе положено. Академические институты Москвы и Новосибирска совместно с Московским и Санкт-Петербургским университетами уже приступили к работе в этом направлении в рамках общего проекта РФФИ.

Важным информационным ресурсом должны стать электронные справочные издания, содержащие фактографические данные о фундаментальных свойствах веществ (структуре, термодинамических параметрах и др.). В первую очередь речь идет о создании электронных версий таких изданий, как “Термодинамические свойства веществ” в 10 томах под редакцией академика В.П.Глушко. Наличие в этих версиях поискового аппарата и набора программных средств для обработки данных позволит использовать их не только в научной работе, но и в образовательных целях, значительно расширив при этом диапазон и сложность учебных задач, перейдя от простых модельных ситуаций к уровню научного исследования.

На виртуальных “полках” академических и университетских библиотек наряду со справочниками должна присутствовать отечественная и зарубежная научная периодика. Только через технологию электронной библиотеки можно будет обеспечить полностью все научные и образовательные организации России этими информационными материалами. И здесь есть первые успехи. Так, по сети стали доступны электронные копии журналов, научные редакции которых находятся в Физико-техническом институте им. А.Ф.Иоффе (http://www.ioffe.rssi.ru/journals). Это — “Физика твердого тела”, “Физика полупроводников” и др.

Развитие науки, как уже отмечалось, идет стремительными темпами. К примеру, в ряде направлений биохимии сегодня информация годичной давности считается уже устаревшей. Важно не только вовремя получить информацию, но и сообщить научной общественности о результатах своих исследований. В этой связи для ускорения публикации эффективным может быть создание в сети Internet отечественных электронных химических журналов или соответствующих приложений к печатным изданиям, как это, к примеру, организуется в Германии издательством “Springer”. Публикации в электронных изданиях должны соответствовать тем же требованиям и правилам, что и в печатных — как по содержанию, так и по соблюдению авторских прав. Только в этом случае статьи в сети Internet станут обладать в глазах научной общественности равными правами с журнальными аналогами. В качестве удачного примера начала такой работы в России можно привести выпуск Алтайским университетом электронного журнала “Химия растительного сырья” (http://www.dcn-asu.ru/journals).

Перечисленные задачи — только часть той большой работы, которую требуется и далее систематически проводить, чтобы создать эффективную информационную инфраструктуру, способную обеспечить потребности науки и образования в России.
 

Работа выполнена при финансовой поддержке РФФИ. Грант 98-07-90122.

.

VIVOS VOCO! - ЗОВУ ЖИВЫХ!
Июль 1999