Влияние информационных технологий на исследователей будущего (или "поможет ли нам Гугель?)

 

au

   
★★
russo> Библиотеки вообще давно пора полностью оцифровывать и подсоединять к нормальным поисковыми системам, без этого они будут терять ревелантность все скорее и скорее

А они во многом уже оцифрованы и подсоединены, только вот доступ к этим базам платный или ограниченный для узкого круга. А в обычную библиотеку, даже университетскую, обычно можно прийти и сидеть до закрытия. Бесплатно.
Когда оцифруют 90% (=всё), доступ бесплатным не станет всё равно.
 

Tico

модератор
★★
Wyvern-2> Контролируя поисковые машины можно контролировать массовое сознание намного эффективней ЦК КПСС или ведомства д-ра Геббельса

Лечится созданием своих собственных поисковых сетей :)

au> Я нарыл патенты, статьи в журналах, включая недоступные мне и неизвестные до тех пор, книги и упоминания о книгах на эту узкоспецифическую тему. В общем и целом на основе аморфной идеи через гугл собрал библиографию (включая сами материалы) на желаемую тему. И подобных "разработок" тем было немало. Гугл — это мощнейший инструмент на сегодня, и его мощь не является его недостатком в случае неспособности части людей им правильно пользоваться.

Так о том и речь, что чтобы работать с ним эффективно, надо уметь им пользоваться. И скорее всего этому надо обучать.

au> В целом суть статьи сводится к развалу системы образования, начиная с младшей школы и заканчивая карьерными профессорами.

Система образования разваливается далеко не только по тем причинам, которые указаны в статье, хотя они тоже имеют значение.
- Барабашка - это научный факт. (с) аФон+  

Wyvern-2

координатор
★★★☆
Wyvern-2>> Контролируя поисковые машины можно контролировать массовое сознание намного эффективней ЦК КПСС или ведомства д-ра Геббельса
Tico> Лечится созданием своих собственных поисковых сетей :)

Я же написал вроде: "массовым", массовым сознанием ;)
Или предлагаешь создавать ПМ ан масс, тэк сказать? (с) :F

Ник
Жизнь коротка, путь искусства долог, удобный случай мимолетен, опыт обманчив.... Ἱπποκράτης  

Fakir

BlueSkyDreamer
★★★
Очень в тему.




...Логика тут отсутствует. В крайнем случае, есть интернет, где по любому поводу найдется исследование британских ученых (в интерпретации той же журналистки), и им можно козырять в дилетантских спорах. Исследование против исследования - это тот же механизм, как учебник против диска. Для мозга, который не имеет центральной иерархии знаний, где каждый кирпичик плотно пригнан, поскольку следует из предыдущего и подтверждается последующим, для такого мозга любая информация воспринимается отдельно подвешенной в пространстве. Таблица умножения, экстрасенс, блокбастер, википедия, совет сотрудницы, реклама в глянце, школьный учебник, воскресная проповедь, статья в блоге, телепередача, молекулярная физика, энергия атома, обнаженная женщина, киллер с лопатой - любая информация имеет равные права, и критерием является все равно вера. Если факт подходит к вере - он годится, не подходит - отметается. Никаких попыток анализа.
 


И действительно - поиск в инете плох тем, что человеку "со стороны" довольно трудно отделить зёрна от плевел. "Пропускающих" рецензентов-то на инете - нетути.

От ведь на что на прошлой неделе напоролся через Яндекс - знатнейшей забористости травища!

Блоги - I.UA 

Блоги - это великолепная возможность рассказать своим друзьям о себе. Заведи и ты свой персональный дневник!

// blog.i.ua
 



А знаете, что искал? Будете смеяться - гуглил по запросу "лапласиан + радиальная часть". И тут среди ссылок на матсправочники, курсы квантовой механики и пр. вот это...
А попадётся такое неокрепшему уму? Да свихнёт найух. Ну как же - наукообразные такие термины. Даже умное слово лапласиан аффтар знает, ага. И знает, где вся современная наука с ним лажается - ну как не зауважать такое матёрое уёбище человечище?! :F
 

Tico

модератор
★★
Продолжение темы. Постинг скопипижжен целиком с знатного блога Centauri Dreams — The News Forum of the Tau Zero Foundation , ссылка на сообщение :

Наука онлайн - сужение возможностей?

... Несколько лет назад я защищал новомодный в то время тренд Интернет-рецензирования в дискуссии с оппонентом, который защищал достоинства традиционных печатных изданий и их методы. В то время, то что со временем превратится в репозиторий препринтов arXiv.org e-Print archive , только начинало расти, и преимущества в наличии широчайшей аудитории, способной оценить научную статью, казались очевидными. Я рассуждал, что тем больше статей и исследовательских работ станут доступными для широкой критики, тем лучше, и те работы, которые ранее не могли пройти барьеры специализированных журналов, теперь смогут быть включены в широкую научную дискуссию.

Но даже в то время, меня беспокоили некоторые тенденции, вновь всплывшие на поверхность в недавнем президентском докладе, процитированном Джеймсом Эвансом, социологом из Чикагского Университета. В докладе заключается следующее сногсшибательное заявление: "Использование подключённых к Интернету цифровых устройств сделало всю сумму человеческих знаний доступной для любого гражданина в любом месте и в любое время". Чудовищная наивность этого утверждения вскружает голову - вообразить себе, что Интернет, чьи закрома полны результатами последних исследований, но в котором огромное количество более ранних знаний представлено в лучшем случае в форме библиографических ссылок, если вообще представлено, может считаться полной библиотекой!

Эванс согласен. У нас нет причин сомневаться в том, что использование печатных материалов сходит на нет, из-за ярких преимуществ сетевого поиска, тем более что библиотечная статистика это подтверждает. И это даже не упоминая такую экзотику, как "цитирование вперёд", при котором более ранние исследования снабжаются ссылками на последующие работы, углубляя перспективу. Будучи заинтересован в дополнительной информации, Эванс опубликовал своё исследование статистики научной базы данных в 34 миллиона работ, изучив их доступность и то, как они используются. Это выдержка из статьи, опубликованной им в Britannica Blog, в которой он утверждает что у сетевой доступности работ есть и теневая сторона:

Чем больше журналов и работ публикуются в электронном виде, тем меньшее количество их цитируется в новых работах, и ссылки в новых работах делаются в основном на недавние же работы. Это верно для всех областей науки. Это не является исторической тенденцией: с каждым годом публикуется больше университетов и авторов, цитирующих всё больше и всё более давних работ, но как только журнал начинает публиковаться в Интернете, характер ссылок в нём сужается в тематическом плане и мельчает в хронологическом.
 


А как насчёт моей идеи о распространении научного знания за пределами ведущих журналов? Она тоже оказалась ошибочной, по крайней мере в социологическом плане. Эванс также выяснил, что внимание исследователей сконцентрировалось именно на наиболее престижных журналах. Вопреки интуиции, результат массовой сетевой публикации идёт во вред качественному научному процессу: высокая эффективность сетевого поиска и механизм гиперссылок приводят к сужению диапазона научных результатов и идей, фактически попадающих на глаза исследователям. И посмотрите на это:

По иронии, результаты моей работы показывают, что наибольшая ценность старомодных научных библиотек заключается именно в их неполном индексировании. Неполное индексирование - по названиям работ и по авторам, в основном внутри изданий - очевидно имело побочным эффектом более тесную интеграцию исследовательской работы и обширных знаний. Заставляя исследователей изучать более широкий диапазон работ для ответов на поставленные вопросы, неполное индексирование способствовало более широкой и глубокой проработке имеющейся информации и имело положительный эффект на деятельность учёных.
 


И конечно, мы можем соотнести это с повседневной практикой обычных пользователей Интернета. Несмотря на то, что на любой запрос поисковые машины выдают широкий диапазон идей, в большинстве случаев пользователь ограничивается первыми двумя-тремя результатами поиска. Когда алгоритм page-rank Гугеля решает за вас, в конечном итоге большинство пользователей видят один-два наиболее популярных сайта. Это приводит к уменьшению вероятности неожиданно наткнуться на интересную идею в процессе исследования обширно представленного материала в приступе интуитивной прозорливости.

Никто не против цифровых баз данных и серверов с препринтами, но не можем ли мы разработать более богатые интерфейсы и методы индексирования, чтобы сохранить плодотворность исследовательской среды на достаточно высоком уровне? Эванс рассматривает это в своей работе, и надеется что прогресс в способах обработки естественной речи сможет повысить релевантность результатов сетевых поисков. Кроме этого, мы конечно же должны расширять наши сетевые библиотеки, чтобы включить в них горы знаний и работ, накопившиеся в процессе научного познания. Иначе мы можем потерять те открытия, которые могут дать нам эти знания в синтезе с позднейшими результатами.

Аннотация работы Эванса, "Электронные публикации и сужение диапазона научного знания", находится здесь: Electronic Publication and the Narrowing of Science and Scholarship

Автор Николас Карр также рассматривает эту проблему в блоге http://www.roughtype.com/archives/2008/08/easy_does_it.php, откуда я цитирую:

Когда этика эффективности из области производства материальных ценностей приходит в область интеллектуального поиска, как это произошло в случае с Интернетом, нас не должно удивлять сужение, а не расширение диапазона научной деятельности. Поисковые движки, в конечном итоге, основаны на популярности, и склонны концентрировать внимание пользователей а не расширять его границы. Как правильно заметил Эванс, их эффективность служит всего лишь усилителем нашей природной лени.
 
- Барабашка - это научный факт. (с) аФон+  6.06.0

au

   
★★
По-моему автор просто не умеет сам или не знает как другие пользуются этими вещами. Может он по бумажной привычке роет несколько избранных журналов или тот арХив. Но это совершенно неоптимальный способ поиска. Сейчас огромное количество журналов объединено под несколькими крышами: ScienceDirect, Interscience, SpringerLink и т.п., и у этих систем средства поиска охватывают весь их материал. Более того, частично подключаются и переводные иностранные журналы, в том числе ретроспективно на много лет. В целом, если надо что-то найти или узнать как дела на каком-то фронте, нужно засесть за такую систему и по ключевым словам пройти по найденным публикациям. В этих системах также библиографии часто с гиперссылками, и в отличие от обычной библиотеки, посыл в какую-то дальнюю сторону не является тупиком, даже если посыл на публикацию затёртого года. Крупные журналы оцифровали весь свой архив, Сайн вообще до первого номера, минус те несколько что вообще утрачены (пока). Так что во всём этом есть лишь ДВЕ проблемы, и ни одна из них автором не упомянута. Первая — доступ, а он не свободный. Вторая — время, которого у человека всегда мало, а читать он вынужден много. Сейчас система так построена, что независимо от наличия умных мыслей, авторы обязаны писать, иначе их зафлудят другие такие же авторы. Большая часть, порой целые тома и стопки томов материалов конференций и целые журналы — это флуд. Без компутерного доступа сквозь этот потоп флуда к искомому не прорваться никак.
 6.06.0

Fakir

BlueSkyDreamer
★★★
> И конечно, мы можем соотнести это с повседневной практикой обычных пользователей Интернета. Несмотря на то, что на любой запрос поисковые машины выдают широкий диапазон идей, в большинстве случаев пользователь ограничивается первыми двумя-тремя результатами поиска. Когда алгоритм page-rank Гугеля решает за вас, в конечном итоге большинство пользователей видят один-два наиболее популярных сайта. Это приводит к уменьшению вероятности неожиданно наткнуться на интересную идею в процессе исследования обширно представленного материала в приступе интуитивной прозорливости.

Есть такой момент...
Прямо хоть обязывай поисковые системы включать в свои алгоритмы сортировки элемент случайности - чтобы иногда ссылки со 124-й страницы результатов поиска выносились на 1-ю :F

"Уровень шума", ага :)
 2.0.0.82.0.0.8

Fakir

BlueSkyDreamer
★★★
au> Большая часть, порой целые тома и стопки томов материалов конференций и целые журналы — это флуд. Без компутерного доступа сквозь этот потоп флуда к искомому не прорваться никак.

Да и с контупером прорываться не то чтоб легче, я бы сказал

И всё еще хуже. На фоне этого флуда "в очередной раз почти о том же" (ну как же, вводные слова-то переписывать и повторять надо в каждой последующей публикации, часто с минимальными изменениями) нередко - да какое нередко, почти систематически - опускаются важные "процедурные" детали, как в том анекдоте про Лившица - "Дау, я вчера в трамвае потерял пять листов выкладок"...

Казалось бы, электронные версии позволяют давать полный "технический" аппендикс с развёрнутыми и разжёванными выкладками, а не дикий экстракт, который нужно переваривать неделями с карандашом и головной болью... Но кто и где подобное видел?
 2.0.0.82.0.0.8

Tico

модератор
★★
au> По-моему автор просто не умеет сам или не знает как другие пользуются этими вещами. Может он по бумажной привычке роет несколько избранных журналов или тот арХив. Но это совершенно неоптимальный способ поиска. Сейчас огромное количество журналов объединено под несколькими крышами: ScienceDirect, Interscience, SpringerLink и т.п., и у этих систем средства поиска охватывают весь их материал.

Но это совершенно не то, что он утверждает. Речь не идёт о том, как он сам ищет, а набранной им статистике. А его статистика говорит, что когда журнал начинает публиковаться в электронном виде плюс даёт возможности продвинутого поиска то диапазон цитирования в нём заметно сужается. Если он не сильно напортачил со статистикой, это факт, которому нужно найти обьяснение.
Обьяснение в общем-то лежит на поверхности. Продвинутый поиск даёт возможность заранее сузить диапазон возможностей, и даёт возможность быстрее добраться до конкретно интересующего куска информации - отсюда меньшее количество процитированных работ. Как правило оцифрованными оказываются более недавние копии, плюс в них явно наиболее современная инфа, поэтому поиск идёт в основном по недавним вариантам. Ну и в сочетании с page rank в топе всегда оказывается пара-тройка постоянных изданий, потому что page rank имеет особенность замораживать ранг со временем, но об этом отдельно, и вообще библиографический интерфейс вовсе не обязан использовать именно этот алгоритм.
Тут другое интересно. Автор вводит такое понятие как "плодотворность научной информационной среды", в общем-то слабо определённое. И продолжает в том направлении, что отмеченное им явление (см. выше), якобы этой плодотворности вредит. Насколько я понимаю его, плодотворность среды для него это свойство информационного поля, в котором плавает некий абстрактный учёный, генерировать в голове этого самого учёного оригинальные идеи через синтез содержащейся в поле информации. Далее, он фактически утверждает, что чем больше информации мы вынудим учёного прокачать через свои мозги в поиске чего-то этому учёному нужного, тем больше вероятность возникновения в голве этого учёного светлых и оригинальных идей. И это, якобы, делает научный процесс в целом, если взять всех учёных вообще, намного более эффективным, чем если бы мы просто дали этому учёному наиболее эффективным способом добраться до тех кусков информации, которая ему конкретно нужна.
И вот это как раз довольно спорно. Особенно учитывая что вы тут вдвоём с Факиром говорили про количество флуда в изданиях, вовсе не факт что прокачивание максимально возможного количество флуда через мозги даст что-то стоящее. Проблема скорее лежит в другом, в том что, действительно, даже до нужной и полезной информации трудно добраться сквозь море флуда.

Есть ещё один забавный момент - ранняя идея online peer review автора постинга, согласно которой чем шире станет доступ к научной информации, тем больше конструктивной критики и идей она будет производить. Это конечно очень всё идеалистично и привлакательно, но эта идеология базируется на неявном предположении, что своё свободное время учёные en masse предпочтут посвящать исключительно рецензированию и обсуждению препринтов arXiv-а ради научного удовольствия :)
- Барабашка - это научный факт. (с) аФон+  6.06.0

au

   
★★
Fakir> Казалось бы, электронные версии позволяют давать полный "технический" аппендикс с развёрнутыми и разжёванными выкладками, а не дикий экстракт, который нужно переваривать неделями с карандашом и головной болью... Но кто и где подобное видел?

В Натуре, Сайнсе, JEB, да и во многих других сейчас есть отдельная "дополнительная информация". Там может быть всё что угодно, что не влезло: выкладки, картинки, описания экспериментов, вплоть до сканов салфеток и видеороликов. Народ начинает ворчать в ту сторону что это "приложение" и есть "научная публикация", а не то что там флудится. И в первых двух ещё ничего вполне, есть содержательные статьи на страницу. А в нишевых флуд идёт на десятки страниц, сомневаюсь что многие это читают — времени не напасёшься.
 6.06.0

au

   
★★
Tico> Есть ещё один забавный момент - ранняя идея online peer review автора постинга, согласно которой чем шире станет доступ к научной информации, тем больше конструктивной критики и идей она будет производить. Это конечно очень всё идеалистично и привлакательно, но эта идеология базируется на неявном предположении, что своё свободное время учёные en masse предпочтут посвящать исключительно рецензированию и обсуждению препринтов arXiv-а ради научного удовольствия :)

По-моему в нынешнем виде пир ревью просто вреден. Для начала должно быть открыто имя рецензентов, как открыты имена в списках всяческих комиссий. Потом, они должны быть добровольцами, а не "приглашёнными", и их должно быть много, а не два-три. Неинтересно никому — значит и печатать нечего, никто не прочитает.
Под покровов сугубой анонимности народ отрыто кладёт на чтение и тем более вникание в читаемое, если сразу не зацепило за "своё". Эффективность процесса низка. В целом же главная проблема в другом: слишком много флуда пишется. Если уж студент на пхд к концу своего диссера имеет более десятка публикаций, хотя у него по сути времени на творческую работу всего один год из трёх — первый он читает, третий он пишет диссер, и лишь второй он по-настоящему что-то ваяет, что потом стоит другим рассказывать. Средних размеров универ в год выпускает до сотни диссеров, это сотни публикаций, которые и без публикования уже изложены в самих диссерах в электронном виде. Плюс будущая профессура флудит по-чёрному, иначе никак не стать профессурой, не выпросить грантов, и т.д. и т.п. Флуд и карьеризм уверенно побеждают науку.
 6.06.0
au> ...Флуд и карьеризм уверенно побеждают науку.

О! Девиз фамильного герба понимаешь так и видится %)
"Вся история науки на каждом шагу показывает, что отдельные личности были более правы в своих утверждениях, чем целые корпорации ученых или сотни и тысячи исследователей, придерживающихся господствующих взглядов". В. И. Вернадский  
RU Владимир Малюх #15.09.2008 08:00  @Fakir#14.09.2008 13:29
+
-
edit
 
Fakir> Казалось бы, электронные версии позволяют давать полный "технический" аппендикс с развёрнутыми и разжёванными выкладками, а не дикий экстракт, который нужно переваривать неделями с карандашом и головной болью... Но кто и где подобное видел?

Редко, но бывает. Немалую долю в сложность поиска вносит ...косность и малограмотность в компьютерных делах самих авторов и публикаторов, это в первую очередь относится к академическим кругам. С упорством, достойным лушего применения используются форматы публикаций, малопригодные для поиска - PostScript, TeX, HTML с вживленными формулами в виде растровых картинок итп итд. Все это мало способствует работе поисковых систем. Люди просто сами не заботятся о том, чтобы их работу было удобно искать.
Maschinen muessen "idiotensicher" werden  7.07.0
RU Владимир Малюх #15.09.2008 08:05  @au#14.09.2008 19:31
+
-
edit
 
au> ... Флуд и карьеризм уверенно побеждают науку.

Вернее - победил и давно, еще в доэлектронную эпоху. %)
Maschinen muessen "idiotensicher" werden  7.07.0

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru