23 декабря 2011 г.

21 Recipes for Mining Twitter by Matthew A. Russell (2011)

   Подбирая себе очередное увлекательное чтение на Amazon.com, наткнулась на спин-офф книги Mining the Social Web (о ней позже) и не смогла пройти мимо, чтобы хотя бы не полистать сабж. На пролистывание мне хватило получаса, т.к. ничего нового я для себя не узнала. Но это я...
   Как становится ясно уже из названия, книга представляет собой сборник рецептов по работе с API Twitter посредством сторонних библиотек для Python: twitter, tweepy, pypi, twitter_text, networkx, couchdb, nltk, redis, geopy. На мой взгляд, можно было пренебречь некоторыми библиотеками, но для полноты картины и общего развития очень даже неплохо, что о них упомянули.
  Типичный пример рецепта: "Требуется получить список всех фолловеров указанного пользователя. Для этого необходимо обратиться к ресурсу /followers/ids. В листинге X-XX представлена реализация данной возможности". Далее следует несколько строк, а то и страниц кода без каких-либо пояснений.
   Заманчивое слово "mining" оказывается всего лишь одним графиком, двумя чартами и словами, что возвращаемые данные будут в формате json. Ни о какой структуризации и анализе собранной информации речи не идет.
   В целом, как сборник рецептов книга сойдет. Также она подойдет тем, кто не хочет разбираться в том, как все работает, а хочет сразу одной кнопкой получить конечный результат. Однако если нужны подробности, или же есть желание использовать возможности API на 100%, а не на 21 рецепт, то советую пройти по ссылке - https://dev.twitter.com/docs - и ознакомиться с оригинальным руководством разработчика.

22 декабря 2011 г.

Новогодняя викторина от @CiscoRussia

   На днях мне довелось поучаствовать в новогодней викторине, проводимой российским представительством компании Cisco Systems. Именно о ней, а если точнее - о моих впечатлениях о ней - и пойдет речь в данном посте.
   Как было анонсировано, данное мероприятие проходило в двух популярных социальных сетях - Facebook и "ВКонтакте". На мой взгляд, это решение было ошибочным. Как показала практика, довольно большое количество народа торопилось попасть в первую десятку (а именно ей присуждался 1 балл) и поэтому не искало ответа, а отвечало самый популярный на текущий момент вариант. А все из-за того, что комментарии открыты и кто угодно может их видеть. Конечно же тут найдутся люди, которые начнут кричать о "прозрачности" проведения конкурса, однако, например, те же комментарии в LiveJournal до определенного момента можно скрывать, а при оглашении результата раскрывать.
   Кроме того, очень не понравился тот факт, что ни на один вопрос не было дано ссылки на правильный ответ. Просто уведомляли - правильный ответ такой-то, выиграли такие-то. Но! Даже сами вопросы были не всегда корректными. Приведу примеры (взято с Facebook):
6) Выберите компанию, которая первой в Европе приобрела решение Vblock.
a) Альфа-Банк b) ТНК-BP c) Coca-Cola Helenik d) Tieto
   Правильного ответа тут нет, т.к. первой компанией была Cobweb и только второй стала присутствующая в списке Tieto. Стоит отметить, что на этот вопрос хотя бы последовал ответ специалиста Cisco:
"Коллеги, добрый день! Вы все проделали замечательную работу! И, безусловно, правы, что ОФИЦИАЛЬНО первым заказчиком Vblock объявил себя CobWeb.
Однако, поставки компаниям были осуществлены, фактически, В ОДНО И ТО ЖЕ ВРЕМЯ. Неразбериху с местами легко объяснить - целевым рынком для Тието сегодня является Россия, а не в Западная Европа. Поэтому, с точки зрения маркетинга, для Tieto логичнее позиционировать себя как “первый в России” заказчик Vblock, чтобы выделиться среди иных “облачных операторов”.
   Другой пример, вызвавший неоднозначную реакцию уже пользователей "ВКонтакте":
8) Каким образом в интерфейсе командной строки Cisco IOS можно быстро очистить настройки сетевого интерфейса?
a) R(config)#interface default fa0/0 b) R(config-if)#default this c) R(config-if)#erase config d) R(config)#drop interface fa0/0 e) R#erase flash:
   Здесь аналогично не приведен правильный ответ, которым является команда:
R(config)#default interface fa0/0
   Ответственное лицо компании объявило - правильный ответ а). Все вопросы участников - как такое может быть? - просто проигнорировали.
   Отдельной темы заслуживает бага (или фича?), которую вовсю использовали пользователи "ВКонтакте", а именно удаление первого (а то и второго) варианта ответа и написания правильного. Как справедливо было замечено, это была абсолютно грамотная тактика - сначала отвечать то, что популярно (а вдруг первый ответил правильно? тогда надо успеть попасть в десятку!), а потом думать или вестись за другими и менять по сто раз свои ответы, благо комментарий удален и никаких следов. Также удивил тот факт, что если у пользователя в комментариях даны противоположные ответы, то из них выбирался только тот, который правильный.
   В целом, идея проведения викторины мне понравилась. Не понравилась ее реализация. Очень надеюсь, что такая солидная контора, как Cisco, сделает правильные выводы и в следующем году аналогичный конкурс проведет на 5+! И хотелось бы все же видеть вопросы на знание и сообразительность, а не на умение пользоваться google...
   P.S. Да, кстати, викторину я не выиграла, хотя не могу сказать, что проявляла большое усердие в этом деле - главное было получить удовольствие от процесса! =)