diff --git a/awstats_data.py b/awstats_data.py index 1c4a0d4..7557469 100644 --- a/awstats_data.py +++ b/awstats_data.py @@ -1,26 +1,26 @@ #This file was automatically generated by iwla_convert.pl. Do not edit manually. -robots = ['appie', 'architext', 'jeeves', 'bjaaland', 'contentmatch', 'ferret', 'googlebot', 'google\-sitemaps', 'gulliver', 'virus[_+ ]detector', 'harvest', 'htdig', 'linkwalker', 'lilina', 'lycos[_+ ]', 'moget', 'muscatferret', 'myweb', 'nomad', 'scooter', 'slurp', '^voyager\/', 'weblayers', 'antibot', 'bruinbot', 'digout4u', 'echo!', 'fast\-webcrawler', 'ia_archiver\-web\.archive\.org', 'ia_archiver', 'jennybot', 'mercator', 'netcraft', 'msnbot\-media', 'msnbot', 'petersnews', 'relevantnoise\.com', 'unlost_web_crawler', 'voila', 'webbase', 'webcollage', 'cfetch', 'zyborg', 'wisenutbot', '[^a]fish', 'abcdatos', 'acme\.spider', 'ahoythehomepagefinder', 'alkaline', 'anthill', 'arachnophilia', 'arale', 'araneo', 'aretha', 'ariadne', 'powermarks', 'arks', 'aspider', 'atn\.txt', 'atomz', 'auresys', 'backrub', 'bbot', 'bigbrother', 'blackwidow', 'blindekuh', 'bloodhound', 'borg\-bot', 'brightnet', 'bspider', 'cactvschemistryspider', 'calif[^r]', 'cassandra', 'cgireader', 'checkbot', 'christcrawler', 'churl', 'cienciaficcion', 'collective', 'combine', 'conceptbot', 'coolbot', 'core', 'cosmos', 'cruiser', 'cusco', 'cyberspyder', 'desertrealm', 'deweb', 'dienstspider', 'digger', 'diibot', 'direct_hit', 'dnabot', 'download_express', 'dragonbot', 'dwcp', 'e\-collector', 'ebiness', 'elfinbot', 'emacs', 'emcspider', 'esther', 'evliyacelebi', 'fastcrawler', 'feedcrawl', 'fdse', 'felix', 'fetchrover', 'fido', 'finnish', 'fireball', 'fouineur', 'francoroute', 'freecrawl', 'funnelweb', 'gama', 'gazz', 'gcreep', 'getbot', 'geturl', 'golem', 'gougou', 'grapnel', 'griffon', 'gromit', 'gulperbot', 'hambot', 'havindex', 'hometown', 'htmlgobble', 'hyperdecontextualizer', 'iajabot', 'iaskspider', 'hl_ftien_spider', 'sogou', 'iconoclast', 'ilse', 'imagelock', 'incywincy', 'informant', 'infoseek', 'infoseeksidewinder', 'infospider', 'inspectorwww', 'intelliagent', 'irobot', 'iron33', 'israelisearch', 'javabee', 'jbot', 'jcrawler', 'jobo', 'jobot', 'joebot', 'jubii', 'jumpstation', 'kapsi', 'katipo', 'kilroy', 'ko[_+ ]yappo[_+ ]robot', 'kummhttp', 'labelgrabber\.txt', 'larbin', 'legs', 'linkidator', 'linkscan', 'lockon', 'logo_gif', 'macworm', 'magpie', 'marvin', 'mattie', 'mediafox', 'merzscope', 'meshexplorer', 'mindcrawler', 'mnogosearch', 'momspider', 'monster', 'motor', 'muncher', 'mwdsearch', 'ndspider', 'nederland\.zoek', 'netcarta', 'netmechanic', 'netscoop', 'newscan\-online', 'nhse', 'northstar', 'nzexplorer', 'objectssearch', 'occam', 'octopus', 'openfind', 'orb_search', 'packrat', 'pageboy', 'parasite', 'patric', 'pegasus', 'perignator', 'perlcrawler', 'phantom', 'phpdig', 'piltdownman', 'pimptrain', 'pioneer', 'pitkow', 'pjspider', 'plumtreewebaccessor', 'poppi', 'portalb', 'psbot', 'python', 'raven', 'rbse', 'resumerobot', 'rhcs', 'road_runner', 'robbie', 'robi', 'robocrawl', 'robofox', 'robozilla', 'roverbot', 'rules', 'safetynetrobot', 'search\-info', 'search_au', 'searchprocess', 'senrigan', 'sgscout', 'shaggy', 'shaihulud', 'sift', 'simbot', 'site\-valet', 'sitetech', 'skymob', 'slcrawler', 'smartspider', 'snooper', 'solbot', 'speedy', 'spider[_+ ]monkey', 'spiderbot', 'spiderline', 'spiderman', 'spiderview', 'spry', 'sqworm', 'ssearcher', 'suke', 'sunrise', 'suntek', 'sven', 'tach_bw', 'tagyu_agent', 'tailrank', 'tarantula', 'tarspider', 'techbot', 'templeton', 'titan', 'titin', 'tkwww', 'tlspider', 'ucsd', 'udmsearch', 'universalfeedparser', 'urlck', 'valkyrie', 'verticrawl', 'victoria', 'visionsearch', 'voidbot', 'vwbot', 'w3index', 'w3m2', 'wallpaper', 'wanderer', 'wapspIRLider', 'webbandit', 'webcatcher', 'webcopy', 'webfetcher', 'webfoot', 'webinator', 'weblinker', 'webmirror', 'webmoose', 'webquest', 'webreader', 'webreaper', 'websnarf', 'webspider', 'webvac', 'webwalk', 'webwalker', 'webwatch', 'whatuseek', 'whowhere', 'wired\-digital', 'wmir', 'wolp', 'wombat', 'wordpress', 'worm', 'woozweb', 'wwwc', 'wz101', 'xget', '1\-more_scanner', 'accoona\-ai\-agent', 'activebookmark', 'adamm_bot', 'almaden', 'aipbot', 'aleadsoftbot', 'alpha_search_agent', 'allrati', 'aport', 'archive\.org_bot', 'argus', 'arianna\.libero\.it', 'aspseek', 'asterias', 'awbot', 'baiduspider', 'becomebot', 'bender', 'betabot', 'biglotron', 'bittorrent_bot', 'biz360[_+ ]spider', 'blogbridge[_+ ]service', 'bloglines', 'blogpulse', 'blogsearch', 'blogshares', 'blogslive', 'blogssay', 'bncf\.firenze\.sbn\.it\/raccolta\.txt', 'bobby', 'boitho\.com\-dc', 'bookmark\-manager', 'boris', 'bumblebee', 'candlelight[_+ ]favorites[_+ ]inspector', 'cbn00glebot', 'cerberian_drtrs', 'cfnetwork', 'cipinetbot', 'checkweb_link_validator', 'commons\-httpclient', 'computer_and_automation_research_institute_crawler', 'converamultimediacrawler', 'converacrawler', 'cscrawler', 'cse_html_validator_lite_online', 'cuasarbot', 'cursor', 'custo', 'datafountains\/dmoz_downloader', 'daviesbot', 'daypopbot', 'deepindex', 'dipsie\.bot', 'dnsgroup', 'domainchecker', 'domainsdb\.net', 'dulance', 'dumbot', 'dumm\.de\-bot', 'earthcom\.info', 'easydl', 'edgeio\-retriever', 'ets_v', 'exactseek', 'extreme[_+ ]picture[_+ ]finder', 'eventax', 'everbeecrawler', 'everest\-vulcan', 'ezresult', 'enteprise', 'facebook', 'fast_enterprise_crawler.*crawleradmin\.t\-info@telekom\.de', 'fast_enterprise_crawler.*t\-info_bi_cluster_crawleradmin\.t\-info@telekom\.de', 'matrix_s\.p\.a\._\-_fast_enterprise_crawler', 'fast_enterprise_crawler', 'fast\-search\-engine', 'favicon', 'favorg', 'favorites_sweeper', 'feedburner', 'feedfetcher\-google', 'feedflow', 'feedster', 'feedsky', 'feedvalidator', 'filmkamerabot', 'findlinks', 'findexa_crawler', 'fooky\.com\/ScorpionBot', 'g2crawler', 'gaisbot', 'geniebot', 'gigabot', 'girafabot', 'global_fetch', 'gnodspider', 'goforit\.com', 'goforitbot', 'gonzo', 'grub', 'gpu_p2p_crawler', 'henrythemiragorobot', 'heritrix', 'holmes', 'hoowwwer', 'hpprint', 'htmlparser', 'html[_+ ]link[_+ ]validator', 'httrack', 'hundesuche\.com\-bot', 'ichiro', 'iltrovatore\-setaccio', 'infobot', 'infociousbot', 'infomine', 'insurancobot', 'internet[_+ ]ninja', 'internetarchive', 'internetseer', 'internetsupervision', 'irlbot', 'isearch2006', 'iupui_research_bot', 'jrtwine[_+ ]software[_+ ]check[_+ ]favorites[_+ ]utility', 'justview', 'kalambot', 'kamano\.de_newsfeedverzeichnis', 'kazoombot', 'kevin', 'keyoshid', 'kinjabot', 'kinja\-imagebot', 'knowitall', 'knowledge\.com', 'kouaa_krawler', 'krugle', 'ksibot', 'kurzor', 'lanshanbot', 'letscrawl\.com', 'libcrawl', 'linkbot', 'link_valet_online', 'metager\-linkchecker', 'linkchecker', 'livejournal\.com', 'lmspider', 'lwp\-request', 'lwp\-trivial', 'magpierss', 'mail\.ru', 'mapoftheinternet\.com', 'mediapartners\-google', 'megite', 'metaspinner', 'microsoft[_+ ]url[_+ ]control', 'mini\-reptile', 'minirank', 'missigua_locator', 'misterbot', 'miva', 'mizzu_labs', 'mj12bot', 'mojeekbot', 'msiecrawler', 'ms_search_4\.0_robot', 'msrabot', 'msrbot', 'mt::telegraph::agent', 'nagios', 'nasa_search', 'mydoyouhike', 'netluchs', 'netsprint', 'newsgatoronline', 'nicebot', 'nimblecrawler', 'noxtrumbot', 'npbot', 'nutchcvs', 'nutchosu\-vlib', 'nutch', 'ocelli', 'octora_beta_bot', 'omniexplorer[_+ ]bot', 'onet\.pl[_+ ]sa', 'onfolio', 'opentaggerbot', 'openwebspider', 'oracle_ultra_search', 'orbiter', 'yodaobot', 'qihoobot', 'passwordmaker\.org', 'pear_http_request_class', 'peerbot', 'perman', 'php[_+ ]version[_+ ]tracker', 'pictureofinternet', 'ping\.blo\.gs', 'plinki', 'pluckfeedcrawler', 'pogodak', 'pompos', 'popdexter', 'port_huron_labs', 'postfavorites', 'projectwf\-java\-test\-crawler', 'proodlebot', 'pyquery', 'rambler', 'redalert', 'rojo', 'rssimagesbot', 'ruffle', 'rufusbot', 'sandcrawler', 'sbider', 'schizozilla', 'scumbot', 'searchguild[_+ ]dmoz[_+ ]experiment', 'seekbot', 'sensis_web_crawler', 'seznambot', 'shim\-crawler', 'shoutcast', 'slysearch', 'snap\.com_beta_crawler', 'sohu\-search', 'sohu', 'snappy', 'sphere_scout', 'spip', 'sproose_crawler', 'steeler', 'steroid__download', 'suchfin\-bot', 'superbot', 'surveybot', 'susie', 'syndic8', 'syndicapi', 'synoobot', 'tcl_http_client_package', 'technoratibot', 'teragramcrawlersurf', 'test_crawler', 'testbot', 't\-h\-u\-n\-d\-e\-r\-s\-t\-o\-n\-e', 'topicblogs', 'turnitinbot', 'turtlescanner', 'turtle', 'tutorgigbot', 'twiceler', 'ubicrawler', 'ultraseek', 'unchaos_bot_hybrid_web_search_engine', 'unido\-bot', 'updated', 'ustc\-semantic\-group', 'vagabondo\-wap', 'vagabondo', 'vermut', 'versus_crawler_from_eda\.baykan@epfl\.ch', 'vespa_crawler', 'vortex', 'vse\/', 'w3c\-checklink', 'w3c[_+ ]css[_+ ]validator[_+ ]jfouffa', 'w3c_validator', 'watchmouse', 'wavefire', 'webclipping\.com', 'webcompass', 'webcrawl\.net', 'web_downloader', 'webdup', 'webfilter', 'webindexer', 'webminer', 'website[_+ ]monitoring[_+ ]bot', 'webvulncrawl', 'wells_search', 'wonderer', 'wume_crawler', 'wwweasel', 'xenu\'s_link_sleuth', 'xenu_link_sleuth', 'xirq', 'y!j', 'yacy', 'yahoo\-blogs', 'yahoo\-verticalcrawler', 'yahoofeedseeker', 'yahooseeker\-testing', 'yahooseeker', 'yahoo\-mmcrawler', 'yahoo!_mindset', 'yandex', 'flexum', 'yanga', 'yooglifetchagent', 'z\-add_link_checker', 'zealbot', 'zhuaxia', 'zspider', 'zeus', 'ng\/1\.', 'ng\/2\.', 'exabot', 'wget', 'libwww', 'java\/[0-9]'] +robots = ['appie', 'architext', 'bingpreview', 'bjaaland', 'contentmatch', 'ferret', 'googlebot', 'google\-sitemaps', 'google[_+ ]web[_+ ]preview', 'gulliver', 'virus[_+ ]detector', 'harvest', 'htdig', 'jeeves', 'linkwalker', 'lilina', 'lycos[_+ ]', 'moget', 'muscatferret', 'myweb', 'nomad', 'scooter', 'slurp', '^voyager\/', 'weblayers', 'antibot', 'bruinbot', 'digout4u', 'echo!', 'fast\-webcrawler', 'ia_archiver\-web\.archive\.org', 'ia_archiver', 'jennybot', 'mercator', 'netcraft', 'msnbot\-media', 'msnbot', 'petersnews', 'relevantnoise\.com', 'unlost_web_crawler', 'voila', 'webbase', 'webcollage', 'cfetch', 'zyborg', 'wisenutbot', '[^a]fish', 'abcdatos', 'acme\.spider', 'ahoythehomepagefinder', 'alkaline', 'anthill', 'arachnophilia', 'arale', 'araneo', 'aretha', 'ariadne', 'powermarks', 'arks', 'aspider', 'atn\.txt', 'atomz', 'auresys', 'backrub', 'bbot', 'bigbrother', 'blackwidow', 'blindekuh', 'bloodhound', 'borg\-bot', 'brightnet', 'bspider', 'cactvschemistryspider', 'calif[^r]', 'cassandra', 'cgireader', 'checkbot', 'christcrawler', 'churl', 'cienciaficcion', 'collective', 'combine', 'conceptbot', 'coolbot', 'core', 'cosmos', 'cruiser', 'cusco', 'cyberspyder', 'desertrealm', 'deweb', 'dienstspider', 'digger', 'diibot', 'direct_hit', 'dnabot', 'download_express', 'dragonbot', 'dwcp', 'e\-collector', 'ebiness', 'elfinbot', 'emacs', 'emcspider', 'esther', 'evliyacelebi', 'fastcrawler', 'feedcrawl', 'fdse', 'felix', 'fetchrover', 'fido', 'finnish', 'fireball', 'fouineur', 'francoroute', 'freecrawl', 'funnelweb', 'gama', 'gazz', 'gcreep', 'getbot', 'geturl', 'golem', 'gougou', 'grapnel', 'griffon', 'gromit', 'gulperbot', 'hambot', 'havindex', 'hometown', 'htmlgobble', 'hyperdecontextualizer', 'iajabot', 'iaskspider', 'hl_ftien_spider', 'sogou', 'iconoclast', 'ilse', 'imagelock', 'incywincy', 'informant', 'infoseek', 'infoseeksidewinder', 'infospider', 'inspectorwww', 'intelliagent', 'irobot', 'iron33', 'israelisearch', 'javabee', 'jbot', 'jcrawler', 'jobo', 'jobot', 'joebot', 'jubii', 'jumpstation', 'kapsi', 'katipo', 'kilroy', 'ko[_+ ]yappo[_+ ]robot', 'kummhttp', 'labelgrabber\.txt', 'larbin', 'legs', 'linkidator', 'linkscan', 'lockon', 'logo_gif', 'macworm', 'magpie', 'marvin', 'mattie', 'mediafox', 'merzscope', 'meshexplorer', 'mindcrawler', 'mnogosearch', 'momspider', 'monster', 'motor', 'muncher', 'mwdsearch', 'ndspider', 'nederland\.zoek', 'netcarta', 'netmechanic', 'netscoop', 'newscan\-online', 'nhse', 'northstar', 'nzexplorer', 'objectssearch', 'occam', 'octopus', 'openfind', 'orb_search', 'packrat', 'pageboy', 'parasite', 'patric', 'pegasus', 'perignator', 'perlcrawler', 'phantom', 'phpdig', 'piltdownman', 'pimptrain', 'pioneer', 'pitkow', 'pjspider', 'plumtreewebaccessor', 'poppi', 'portalb', 'psbot', 'python', 'raven', 'rbse', 'resumerobot', 'rhcs', 'road_runner', 'robbie', 'robi', 'robocrawl', 'robofox', 'robozilla', 'roverbot', 'rules', 'safetynetrobot', 'search\-info', 'search_au', 'searchprocess', 'senrigan', 'sgscout', 'shaggy', 'shaihulud', 'sift', 'simbot', 'site\-valet', 'sitetech', 'skymob', 'slcrawler', 'smartspider', 'snooper', 'solbot', 'speedy', 'spider[_+ ]monkey', 'spiderbot', 'spiderline', 'spiderman', 'spiderview', 'spry', 'sqworm', 'ssearcher', 'suke', 'sunrise', 'suntek', 'sven', 'tach_bw', 'tagyu_agent', 'tailrank', 'tarantula', 'tarspider', 'techbot', 'templeton', 'titan', 'titin', 'tkwww', 'tlspider', 'ucsd', 'udmsearch', 'universalfeedparser', 'urlck', 'valkyrie', 'verticrawl', 'victoria', 'visionsearch', 'voidbot', 'vwbot', 'w3index', 'w3m2', 'wallpaper', 'wanderer', 'wapspIRLider', 'webbandit', 'webcatcher', 'webcopy', 'webfetcher', 'webfoot', 'webinator', 'weblinker', 'webmirror', 'webmoose', 'webquest', 'webreader', 'webreaper', 'websnarf', 'webspider', 'webvac', 'webwalk', 'webwalker', 'webwatch', 'whatuseek', 'whowhere', 'wired\-digital', 'wmir', 'wolp', 'wombat', 'wordpress', 'worm', 'woozweb', 'wwwc', 'wz101', 'xget', '1\-more_scanner', 'accoona\-ai\-agent', 'activebookmark', 'adamm_bot', 'almaden', 'aipbot', 'aleadsoftbot', 'alpha_search_agent', 'allrati', 'aport', 'archive\.org_bot', 'argus', 'arianna\.libero\.it', 'aspseek', 'asterias', 'awbot', 'baiduspider', 'becomebot', 'bender', 'betabot', 'biglotron', 'bittorrent_bot', 'biz360[_+ ]spider', 'blogbridge[_+ ]service', 'bloglines', 'blogpulse', 'blogsearch', 'blogshares', 'blogslive', 'blogssay', 'bncf\.firenze\.sbn\.it\/raccolta\.txt', 'bobby', 'boitho\.com\-dc', 'bookmark\-manager', 'boris', 'bumblebee', 'candlelight[_+ ]favorites[_+ ]inspector', 'cbn00glebot', 'cerberian_drtrs', 'cfnetwork', 'cipinetbot', 'checkweb_link_validator', 'commons\-httpclient', 'computer_and_automation_research_institute_crawler', 'converamultimediacrawler', 'converacrawler', 'cscrawler', 'cse_html_validator_lite_online', 'cuasarbot', 'cursor', 'custo', 'datafountains\/dmoz_downloader', 'daviesbot', 'daypopbot', 'deepindex', 'dipsie\.bot', 'dnsgroup', 'domainchecker', 'domainsdb\.net', 'dulance', 'dumbot', 'dumm\.de\-bot', 'earthcom\.info', 'easydl', 'edgeio\-retriever', 'ets_v', 'exactseek', 'extreme[_+ ]picture[_+ ]finder', 'eventax', 'everbeecrawler', 'everest\-vulcan', 'ezresult', 'enteprise', 'facebook', 'fast_enterprise_crawler.*crawleradmin\.t\-info@telekom\.de', 'fast_enterprise_crawler.*t\-info_bi_cluster_crawleradmin\.t\-info@telekom\.de', 'matrix_s\.p\.a\._\-_fast_enterprise_crawler', 'fast_enterprise_crawler', 'fast\-search\-engine', 'favicon', 'favorg', 'favorites_sweeper', 'feedburner', 'feedfetcher\-google', 'feedflow', 'feedster', 'feedsky', 'feedvalidator', 'filmkamerabot', 'findlinks', 'findexa_crawler', 'fooky\.com\/ScorpionBot', 'g2crawler', 'gaisbot', 'geniebot', 'gigabot', 'girafabot', 'global_fetch', 'gnodspider', 'goforit\.com', 'goforitbot', 'gonzo', 'grub', 'gpu_p2p_crawler', 'henrythemiragorobot', 'heritrix', 'holmes', 'hoowwwer', 'hpprint', 'htmlparser', 'html[_+ ]link[_+ ]validator', 'httrack', 'hundesuche\.com\-bot', 'ichiro', 'iltrovatore\-setaccio', 'infobot', 'infociousbot', 'infomine', 'insurancobot', 'internet[_+ ]ninja', 'internetarchive', 'internetseer', 'internetsupervision', 'irlbot', 'isearch2006', 'iupui_research_bot', 'jrtwine[_+ ]software[_+ ]check[_+ ]favorites[_+ ]utility', 'justview', 'kalambot', 'kamano\.de_newsfeedverzeichnis', 'kazoombot', 'kevin', 'keyoshid', 'kinjabot', 'kinja\-imagebot', 'knowitall', 'knowledge\.com', 'kouaa_krawler', 'krugle', 'ksibot', 'kurzor', 'lanshanbot', 'letscrawl\.com', 'libcrawl', 'linkbot', 'link_valet_online', 'metager\-linkchecker', 'linkchecker', 'livejournal\.com', 'lmspider', 'lwp\-request', 'lwp\-trivial', 'magpierss', 'mail\.ru', 'mapoftheinternet\.com', 'mediapartners\-google', 'megite', 'metaspinner', 'microsoft[_+ ]url[_+ ]control', 'mini\-reptile', 'minirank', 'missigua_locator', 'misterbot', 'miva', 'mizzu_labs', 'mj12bot', 'mojeekbot', 'msiecrawler', 'ms_search_4\.0_robot', 'msrabot', 'msrbot', 'mt::telegraph::agent', 'nagios', 'nasa_search', 'mydoyouhike', 'netluchs', 'netsprint', 'newsgatoronline', 'nicebot', 'nimblecrawler', 'noxtrumbot', 'npbot', 'nutchcvs', 'nutchosu\-vlib', 'nutch', 'ocelli', 'octora_beta_bot', 'omniexplorer[_+ ]bot', 'onet\.pl[_+ ]sa', 'onfolio', 'opentaggerbot', 'openwebspider', 'oracle_ultra_search', 'orbiter', 'yodaobot', 'qihoobot', 'passwordmaker\.org', 'pear_http_request_class', 'peerbot', 'perman', 'php[_+ ]version[_+ ]tracker', 'pictureofinternet', 'ping\.blo\.gs', 'plinki', 'pluckfeedcrawler', 'pogodak', 'pompos', 'popdexter', 'port_huron_labs', 'postfavorites', 'projectwf\-java\-test\-crawler', 'proodlebot', 'pyquery', 'rambler', 'redalert', 'rojo', 'rssimagesbot', 'ruffle', 'rufusbot', 'sandcrawler', 'sbider', 'schizozilla', 'scumbot', 'searchguild[_+ ]dmoz[_+ ]experiment', 'seekbot', 'sensis_web_crawler', 'seznambot', 'shim\-crawler', 'shoutcast', 'slysearch', 'snap\.com_beta_crawler', 'sohu\-search', 'sohu', 'snappy', 'sphere_scout', 'spip', 'sproose_crawler', 'steeler', 'steroid__download', 'suchfin\-bot', 'superbot', 'surveybot', 'susie', 'syndic8', 'syndicapi', 'synoobot', 'tcl_http_client_package', 'technoratibot', 'teragramcrawlersurf', 'test_crawler', 'testbot', 't\-h\-u\-n\-d\-e\-r\-s\-t\-o\-n\-e', 'topicblogs', 'turnitinbot', 'turtlescanner', 'turtle', 'tutorgigbot', 'twiceler', 'ubicrawler', 'ultraseek', 'unchaos_bot_hybrid_web_search_engine', 'unido\-bot', 'updated', 'ustc\-semantic\-group', 'vagabondo\-wap', 'vagabondo', 'vermut', 'versus_crawler_from_eda\.baykan@epfl\.ch', 'vespa_crawler', 'vortex', 'vse\/', 'w3c\-checklink', 'w3c[_+ ]css[_+ ]validator[_+ ]jfouffa', 'w3c_validator', 'watchmouse', 'wavefire', 'webclipping\.com', 'webcompass', 'webcrawl\.net', 'web_downloader', 'webdup', 'webfilter', 'webindexer', 'webminer', 'website[_+ ]monitoring[_+ ]bot', 'webvulncrawl', 'wells_search', 'wonderer', 'wume_crawler', 'wwweasel', 'xenu\'s_link_sleuth', 'xenu_link_sleuth', 'xirq', 'y!j', 'yacy', 'yahoo\-blogs', 'yahoo\-verticalcrawler', 'yahoofeedseeker', 'yahooseeker\-testing', 'yahooseeker', 'yahoo\-mmcrawler', 'yahoo!_mindset', 'yandex', 'flexum', 'yanga', 'yooglifetchagent', 'z\-add_link_checker', 'zealbot', 'zhuaxia', 'zspider', 'zeus', 'ng\/1\.', 'ng\/2\.', 'exabot', '^[1-3]$', 'alltop', 'applesyndication', 'asynchttpclient', 'bingbot', 'blogged_crawl', 'bloglovin', 'butterfly', 'buzztracker', 'carpathia', 'catbot', 'chattertrap', 'check_http', 'coldfusion', 'covario', 'daylifefeedfetcher', 'discobot', 'dlvr\.it', 'dreamwidth', 'drupal', 'ezoom', 'feedmyinbox', 'feedroll\.com', 'feedzira', 'fever\/', 'freenews', 'geohasher', 'hanrss', 'inagist', 'jacobin club', 'jakarta', 'js\-kit', 'largesmall crawler', 'linkedinbot', 'longurl', 'metauri', 'microsoft\-webdav\-miniredir', '^motorola$', 'movabletype', '^mozilla\/3\.0 \(compatible$', '^mozilla\/4\.0$', '^mozilla\/4\.0 \(compatible;\)$', '^mozilla\/5\.0$', '^mozilla\/5\.0 \(compatible;$', '^mozilla\/5\.0 \(en\-us\)$', '^mozilla\/5\.0 firefox\/3\.0\.5$', '^msie', 'netnewswire', ' netseer ', 'netvibes', 'newrelicpinger', 'newsfox', 'nextgensearchbot', 'ning', 'pingdom', 'pita', 'postpost', 'postrank', 'printfulbot', 'protopage', 'proximic', 'quipply', 'r6\_', 'ratingburner', 'regator', 'rome client', 'rpt\-httpclient', 'rssgraffiti', 'sage\+\+', 'scoutjet', 'simplepie', 'sitebot', 'summify\.com', 'superfeedr', 'synthesio', 'teoma', 'topblogsinfo', 'topix\.net', 'trapit', 'trileet', 'tweetedtimes', 'twisted pagegetter', 'twitterbot', 'twitterfeed', 'unwindfetchor', 'wazzup', 'windows\-rss\-platform', 'wiumi', 'xydo', 'yahoo! slurp', 'yahoo pipes', 'yahoo\-newscrawler', 'yahoocachesystem', 'yahooexternalcache', 'yahoo! searchmonkey', 'yahooysmcm', 'yammer', 'yandexbot', 'yeti', 'yie8', 'youdao', 'yourls', 'zemanta', 'zend_http_client', 'wget', 'libwww', '^java\/[0-9]'] search_engines = ['google\.[\w.]+/products', 'base\.google\.', 'froogle\.google\.', 'groups\.google\.', 'images\.google\.', 'google\.', 'googlee\.', 'googlecom\.com', 'goggle\.co\.hu', '216\.239\.(35|37|39|51)\.100', '216\.239\.(35|37|39|51)\.101', '216\.239\.5[0-9]\.104', '64\.233\.1[0-9]{2}\.104', '66\.102\.[1-9]\.104', '66\.249\.93\.104', '72\.14\.2[0-9]{2}\.104', 'msn\.', 'live\.com', 'bing\.', 'voila\.', 'mindset\.research\.yahoo', 'yahoo\.', '(66\.218\.71\.225|216\.109\.117\.135|216\.109\.125\.130|66\.218\.69\.11)', 'search\.aol\.co', 'tiscali\.', 'lycos\.', 'alexa\.com', 'alltheweb\.com', 'altavista\.', 'a9\.com', 'dmoz\.org', 'netscape\.', 'search\.terra\.', 'www\.search\.com', 'search\.sli\.sympatico\.ca', 'excite\.'] -search_engines_2 = ['4\-counter\.com', 'att\.net', 'bungeebonesdotcom', 'northernlight\.', 'hotbot\.', 'kvasir\.', 'webcrawler\.', 'metacrawler\.', 'go2net\.com', '(^|\.)go\.com', 'euroseek\.', 'looksmart\.', 'spray\.', 'nbci\.com\/search', 'de\.ask.\com', 'es\.ask.\com', 'fr\.ask.\com', 'it\.ask.\com', 'nl\.ask.\com', 'uk\.ask.\com', '(^|\.)ask\.com', 'atomz\.', 'overture\.com', 'teoma\.', 'findarticles\.com', 'infospace\.com', 'mamma\.', 'dejanews\.', 'dogpile\.com', 'wisenut\.com', 'ixquick\.com', 'search\.earthlink\.net', 'i-une\.com', 'blingo\.com', 'centraldatabase\.org', 'clusty\.com', 'mysearch\.', 'vivisimo\.com', 'kartoo\.com', 'icerocket\.com', 'sphere\.com', 'ledix\.net', 'start\.shaw\.ca', 'searchalot\.com', 'copernic\.com', 'avantfind\.com', 'steadysearch\.com', 'steady-search\.com', 'chello\.at', 'chello\.be', 'chello\.cz', 'chello\.fr', 'chello\.hu', 'chello\.nl', 'chello\.no', 'chello\.pl', 'chello\.se', 'chello\.sk', 'chello', 'mirago\.be', 'mirago\.ch', 'mirago\.de', 'mirago\.dk', 'es\.mirago\.com', 'mirago\.fr', 'mirago\.it', 'mirago\.nl', 'no\.mirago\.com', 'mirago\.se', 'mirago\.co\.uk', 'mirago', 'answerbus\.com', 'icq\.com\/search', 'nusearch\.com', 'goodsearch\.com', 'scroogle\.org', 'questionanswering\.com', 'mywebsearch\.com', 'as\.starware\.com', 'del\.icio\.us', 'digg\.com', 'stumbleupon\.com', 'swik\.net', 'segnalo\.alice\.it', 'ineffabile\.it', 'anzwers\.com\.au', 'engine\.exe', 'miner\.bol\.com\.br', '\.baidu\.com', '\.vnet\.cn', '\.soso\.com', '\.sogou\.com', '\.3721\.com', 'iask\.com', '\.accoona\.com', '\.163\.com', '\.zhongsou\.com', 'atlas\.cz', 'seznam\.cz', 'quick\.cz', 'centrum\.cz', 'jyxo\.(cz|com)', 'najdi\.to', 'redbox\.cz', 'opasia\.dk', 'danielsen\.com', 'sol\.dk', 'jubii\.dk', 'find\.dk', 'edderkoppen\.dk', 'netstjernen\.dk', 'orbis\.dk', 'tyfon\.dk', '1klik\.dk', 'ofir\.dk', 'ilse\.', 'vindex\.', '(^|\.)ask\.co\.uk', 'bbc\.co\.uk/cgi-bin/search', 'ifind\.freeserve', 'looksmart\.co\.uk', 'splut\.', 'spotjockey\.', 'ukdirectory\.', 'ukindex\.co\.uk', 'ukplus\.', 'searchy\.co\.uk', 'haku\.www\.fi', 'recherche\.aol\.fr', 'ctrouve\.', 'francite\.', '\.lbb\.org', 'rechercher\.libertysurf\.fr', 'search[\w\-]+\.free\.fr', 'recherche\.club-internet\.fr', 'toile\.com', 'biglotron\.com', 'mozbot\.fr', 'sucheaol\.aol\.de', 'fireball\.de', 'infoseek\.de', 'suche\d?\.web\.de', '[a-z]serv\.rrzn\.uni-hannover\.de', 'suchen\.abacho\.de', '(brisbane|suche)\.t-online\.de', 'allesklar\.de', 'meinestadt\.de', '212\.227\.33\.241', '(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)', 'wwweasel\.de', 'netluchs\.de', 'schoenerbrausen\.de', 'heureka\.hu', 'vizsla\.origo\.hu', 'lapkereso\.hu', 'goliat\.hu', 'index\.hu', 'wahoo\.hu', 'webmania\.hu', 'search\.internetto\.hu', 'tango\.hu', 'keresolap\.hu', 'polymeta\.hu', 'sify\.com', 'virgilio\.it', 'arianna\.libero\.it', 'supereva\.com', 'kataweb\.it', 'search\.alice\.it\.master', 'search\.alice\.it', 'gotuneed\.com', 'godado', 'jumpy\.it', 'shinyseek\.it', 'teecno\.it', 'ask\.jp', 'sagool\.jp', 'sok\.start\.no', 'eniro\.no', 'szukaj\.wp\.pl', 'szukaj\.onet\.pl', 'dodaj\.pl', 'gazeta\.pl', 'gery\.pl', 'hoga\.pl', 'netsprint\.pl', 'interia\.pl', 'katalog\.onet\.pl', 'o2\.pl', 'polska\.pl', 'szukacz\.pl', 'wow\.pl', 'ya(ndex)?\.ru', 'aport\.ru', 'rambler\.ru', 'turtle\.ru', 'metabot\.ru', 'evreka\.passagen\.se', 'eniro\.se', 'zoznam\.sk', 'sapo\.pt', 'search\.ch', 'search\.bluewin\.ch', 'pogodak\.'] +search_engines_2 = ['4\-counter\.com', 'att\.net', 'bungeebonesdotcom', 'northernlight\.', 'hotbot\.', 'kvasir\.', 'webcrawler\.', 'metacrawler\.', 'go2net\.com', '(^|\.)go\.com', 'euroseek\.', 'looksmart\.', 'spray\.', 'nbci\.com\/search', 'de\.ask.\com', 'es\.ask.\com', 'fr\.ask.\com', 'it\.ask.\com', 'nl\.ask.\com', 'uk\.ask.\com', '(^|\.)ask\.com', 'atomz\.', 'overture\.com', 'teoma\.', 'findarticles\.com', 'infospace\.com', 'mamma\.', 'dejanews\.', 'dogpile\.com', 'wisenut\.com', 'ixquick\.com', 'search\.earthlink\.net', 'i-une\.com', 'blingo\.com', 'centraldatabase\.org', 'clusty\.com', 'mysearch\.', 'vivisimo\.com', 'kartoo\.com', 'icerocket\.com', 'sphere\.com', 'ledix\.net', 'start\.shaw\.ca', 'searchalot\.com', 'copernic\.com', 'avantfind\.com', 'steadysearch\.com', 'steady-search\.com', 'claro-search\.com', 'www1\.search-results\.com', 'www\.holasearch\.com', 'search\.conduit\.com', 'static\.flipora\.com', '(?:www[12]?|mixidj)\.delta-search\.com', 'start\.iminent\.com', 'www\.searchmobileonline\.com', 'int\.search-results\.com', 'chello\.at', 'chello\.be', 'chello\.cz', 'chello\.fr', 'chello\.hu', 'chello\.nl', 'chello\.no', 'chello\.pl', 'chello\.se', 'chello\.sk', 'chello', 'mirago\.be', 'mirago\.ch', 'mirago\.de', 'mirago\.dk', 'es\.mirago\.com', 'mirago\.fr', 'mirago\.it', 'mirago\.nl', 'no\.mirago\.com', 'mirago\.se', 'mirago\.co\.uk', 'mirago', 'answerbus\.com', 'icq\.com\/search', 'nusearch\.com', 'goodsearch\.com', 'scroogle\.org', 'questionanswering\.com', 'mywebsearch\.com', 'as\.starware\.com', 'del\.icio\.us', 'digg\.com', 'stumbleupon\.com', 'swik\.net', 'segnalo\.alice\.it', 'ineffabile\.it', 'anzwers\.com\.au', 'engine\.exe', 'miner\.bol\.com\.br', '\.baidu\.com', '\.vnet\.cn', '\.soso\.com', '\.sogou\.com', '\.3721\.com', 'iask\.com', '\.accoona\.com', '\.163\.com', '\.zhongsou\.com', 'atlas\.cz', 'seznam\.cz', 'quick\.cz', 'centrum\.cz', 'jyxo\.(cz|com)', 'najdi\.to', 'redbox\.cz', 'isearch\.avg\.com', 'opasia\.dk', 'danielsen\.com', 'sol\.dk', 'jubii\.dk', 'find\.dk', 'edderkoppen\.dk', 'netstjernen\.dk', 'orbis\.dk', 'tyfon\.dk', '1klik\.dk', 'ofir\.dk', 'ilse\.', 'vindex\.', '(^|\.)ask\.co\.uk', 'bbc\.co\.uk/cgi-bin/search', 'ifind\.freeserve', 'looksmart\.co\.uk', 'splut\.', 'spotjockey\.', 'ukdirectory\.', 'ukindex\.co\.uk', 'ukplus\.', 'searchy\.co\.uk', 'search\.fbdownloader\.com', 'search\.babylon\.com', 'haku\.www\.fi', 'recherche\.aol\.fr', 'ctrouve\.', 'francite\.', '\.lbb\.org', 'rechercher\.libertysurf\.fr', 'search[\w\-]+\.free\.fr', 'recherche\.club-internet\.fr', 'toile\.com', 'biglotron\.com', 'mozbot\.fr', 'sucheaol\.aol\.de', 'o2suche\.aol\.de', 'fireball\.de', 'infoseek\.de', 'suche\d?\.web\.de', '[a-z]serv\.rrzn\.uni-hannover\.de', 'suchen\.abacho\.de', '(brisbane|suche)\.t-online\.de', 'allesklar\.de', 'meinestadt\.de', '212\.227\.33\.241', '(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)', 'wwweasel\.de', 'netluchs\.de', 'schoenerbrausen\.de', 'suche\.gmx\.net', 'ecosia\.org', 'de\.aolsearch\.com', 'suche\.aol\.de', 'www\.startxxl\.com', 'www\.benefind\.de', 'heureka\.hu', 'vizsla\.origo\.hu', 'lapkereso\.hu', 'goliat\.hu', 'index\.hu', 'wahoo\.hu', 'webmania\.hu', 'search\.internetto\.hu', 'tango\.hu', 'keresolap\.hu', 'polymeta\.hu', 'sify\.com', 'virgilio\.it', 'arianna\.libero\.it', 'supereva\.com', 'kataweb\.it', 'search\.alice\.it\.master', 'search\.alice\.it', 'gotuneed\.com', 'godado', 'jumpy\.it', 'shinyseek\.it', 'teecno\.it', 'search\.genieo\.com', 'ask\.jp', 'sagool\.jp', 'sok\.start\.no', 'eniro\.no', 'szukaj\.wp\.pl', 'szukaj\.onet\.pl', 'dodaj\.pl', 'gazeta\.pl', 'gery\.pl', 'hoga\.pl', 'netsprint\.pl', 'interia\.pl', 'katalog\.onet\.pl', 'o2\.pl', 'polska\.pl', 'szukacz\.pl', 'wow\.pl', 'ya(ndex)?\.ru', 'aport\.ru', 'rambler\.ru', 'turtle\.ru', 'metabot\.ru', 'evreka\.passagen\.se', 'eniro\.se', 'zoznam\.sk', 'sapo\.pt', 'search\.ch', 'search\.bluewin\.ch', 'pogodak\.'] -not_search_engines_keys = {'yahoo\.' : '(?:picks|mail)\.yahoo\.|yahoo\.[^/]+/picks', 'altavista\.' : 'babelfish\.altavista\.', 'tiscali\.' : 'mail\.tiscali\.', 'yandex\.' : 'direct\.yandex\.', 'google\.' : 'translate\.google\.', 'msn\.' : 'hotmail\.msn\.'} +not_search_engines_keys = {'tiscali\.' : 'mail\.tiscali\.', 'yandex\.' : 'direct\.yandex\.', 'altavista\.' : 'babelfish\.altavista\.', 'yahoo\.' : '(?:picks|mail)\.yahoo\.|yahoo\.[^/]+/picks', 'google\.' : 'translate\.google\.', 'msn\.' : 'hotmail\.msn\.'} -search_engines_hashid = {'search\.sli\.sympatico\.ca' : 'sympatico', 'mywebsearch\.com' : 'mywebsearch', 'netsprint\.pl\/hoga\-search' : 'hogapl', 'findarticles\.com' : 'findarticles', 'wow\.pl' : 'wowpl', 'allesklar\.de' : 'allesklar', 'atomz\.' : 'atomz', 'bing\.' : 'bing', 'find\.dk' : 'finddk', 'google\.' : 'google', '(66\.218\.71\.225|216\.109\.117\.135|216\.109\.125\.130|66\.218\.69\.11)' : 'yahoo', 'pogodak\.' : 'pogodak', 'ask\.jp' : 'askjp', '\.baidu\.com' : 'baidu', 'tango\.hu' : 'tango_hu', 'gotuneed\.com' : 'gotuneed', 'quick\.cz' : 'quick', 'mirago' : 'mirago', 'szukaj\.wp\.pl' : 'wp', 'mirago\.de' : 'miragode', 'mirago\.dk' : 'miragodk', 'katalog\.onet\.pl' : 'katalogonetpl', 'googlee\.' : 'google', 'orbis\.dk' : 'orbis', 'turtle\.ru' : 'turtle', 'zoznam\.sk' : 'zoznam', 'start\.shaw\.ca' : 'shawca', 'chello\.at' : 'chelloat', 'centraldatabase\.org' : 'centraldatabase', 'centrum\.cz' : 'centrum', 'kataweb\.it' : 'kataweb', '\.lbb\.org' : 'lbb', 'blingo\.com' : 'blingo', 'vivisimo\.com' : 'vivisimo', 'stumbleupon\.com' : 'stumbleupon', 'es\.ask.\com' : 'askes', 'interia\.pl' : 'interiapl', '[a-z]serv\.rrzn\.uni-hannover\.de' : 'meta', 'search\.alice\.it' : 'aliceit', 'shinyseek\.it' : 'shinyseek\.it', 'i-une\.com' : 'iune', 'dejanews\.' : 'dejanews', 'opasia\.dk' : 'opasia', 'chello\.cz' : 'chellocz', 'ya(ndex)?\.ru' : 'yandex', 'kartoo\.com' : 'kartoo', 'arianna\.libero\.it' : 'arianna', 'ofir\.dk' : 'ofir', 'search\.earthlink\.net' : 'earthlink', 'biglotron\.com' : 'biglotron', 'lapkereso\.hu' : 'lapkereso', '216\.239\.(35|37|39|51)\.101' : 'google_cache', 'miner\.bol\.com\.br' : 'miner', 'dodaj\.pl' : 'dodajpl', 'mirago\.be' : 'miragobe', 'googlecom\.com' : 'google', 'steadysearch\.com' : 'steadysearch', 'redbox\.cz' : 'redbox', 'haku\.www\.fi' : 'haku', 'sapo\.pt' : 'sapo', 'sphere\.com' : 'sphere', 'danielsen\.com' : 'danielsen', 'alexa\.com' : 'alexa', 'mamma\.' : 'mamma', 'swik\.net' : 'swik', 'polska\.pl' : 'polskapl', 'groups\.google\.' : 'google_groups', 'metabot\.ru' : 'metabot', 'rechercher\.libertysurf\.fr' : 'libertysurf', 'szukaj\.onet\.pl' : 'onetpl', 'aport\.ru' : 'aport', 'de\.ask.\com' : 'askde', 'splut\.' : 'splut', 'live\.com' : 'live', '216\.239\.5[0-9]\.104' : 'google_cache', 'mysearch\.' : 'mysearch', 'ukplus\.' : 'ukplus', 'najdi\.to' : 'najdi', 'overture\.com' : 'overture', 'iask\.com' : 'iask', 'nl\.ask.\com' : 'asknl', 'nbci\.com\/search' : 'nbci', 'search\.aol\.co' : 'aol', 'eniro\.se' : 'enirose', '64\.233\.1[0-9]{2}\.104' : 'google_cache', 'mirago\.ch' : 'miragoch', 'altavista\.' : 'altavista', 'chello\.hu' : 'chellohu', 'mozbot\.fr' : 'mozbot', 'northernlight\.' : 'northernlight', 'mirago\.co\.uk' : 'miragocouk', 'search[\w\-]+\.free\.fr' : 'free', 'mindset\.research\.yahoo' : 'yahoo_mindset', 'copernic\.com' : 'copernic', 'heureka\.hu' : 'heureka', 'steady-search\.com' : 'steadysearch', 'teecno\.it' : 'teecnoit', 'voila\.' : 'voila', 'netstjernen\.dk' : 'netstjernen', 'keresolap\.hu' : 'keresolap_hu', 'yahoo\.' : 'yahoo', 'icerocket\.com' : 'icerocket', 'alltheweb\.com' : 'alltheweb', 'www\.search\.com' : 'search.com', 'digg\.com' : 'digg', 'tiscali\.' : 'tiscali', 'spotjockey\.' : 'spotjockey', 'a9\.com' : 'a9', '(brisbane|suche)\.t-online\.de' : 't-online', 'ifind\.freeserve' : 'freeserve', 'att\.net' : 'att', 'mirago\.it' : 'miragoit', 'index\.hu' : 'indexhu', '\.sogou\.com' : 'sogou', 'no\.mirago\.com' : 'miragono', 'ineffabile\.it' : 'ineffabile', 'netluchs\.de' : 'netluchs', 'toile\.com' : 'toile', 'search\..*\.\w+' : 'search', 'del\.icio\.us' : 'delicious', 'vizsla\.origo\.hu' : 'origo', 'netscape\.' : 'netscape', 'dogpile\.com' : 'dogpile', 'anzwers\.com\.au' : 'anzwers', '\.zhongsou\.com' : 'zhongsou', 'ctrouve\.' : 'ctrouve', 'gazeta\.pl' : 'gazetapl', 'recherche\.club-internet\.fr' : 'clubinternet', 'sok\.start\.no' : 'start', 'scroogle\.org' : 'scroogle', 'schoenerbrausen\.de' : 'schoenerbrausen', 'looksmart\.co\.uk' : 'looksmartuk', 'wwweasel\.de' : 'wwweasel', 'godado' : 'godado', '216\.239\.(35|37|39|51)\.100' : 'google_cache', 'jubii\.dk' : 'jubii', '212\.227\.33\.241' : 'metaspinner', 'mirago\.fr' : 'miragofr', 'sol\.dk' : 'sol', 'bbc\.co\.uk/cgi-bin/search' : 'bbc', 'jumpy\.it' : 'jumpy\.it', 'francite\.' : 'francite', 'infoseek\.de' : 'infoseek', 'es\.mirago\.com' : 'miragoes', 'jyxo\.(cz|com)' : 'jyxo', 'hotbot\.' : 'hotbot', 'engine\.exe' : 'engine', '(^|\.)ask\.com' : 'ask', 'goliat\.hu' : 'goliat', 'wisenut\.com' : 'wisenut', 'mirago\.nl' : 'miragonl', 'base\.google\.' : 'google_base', 'search\.bluewin\.ch' : 'bluewin', 'lycos\.' : 'lycos', 'meinestadt\.de' : 'meinestadt', '4\-counter\.com' : 'google4counter', 'search\.alice\.it\.master' : 'aliceitmaster', 'teoma\.' : 'teoma', '(^|\.)ask\.co\.uk' : 'askuk', 'tyfon\.dk' : 'tyfon', 'froogle\.google\.' : 'google_froogle', 'ukdirectory\.' : 'ukdirectory', 'ledix\.net' : 'ledix', 'edderkoppen\.dk' : 'edderkoppen', 'recherche\.aol\.fr' : 'aolfr', 'google\.[\w.]+/products' : 'google_products', 'webmania\.hu' : 'webmania', 'searchy\.co\.uk' : 'searchy', 'fr\.ask.\com' : 'askfr', 'spray\.' : 'spray', '72\.14\.2[0-9]{2}\.104' : 'google_cache', 'eniro\.no' : 'eniro', 'goodsearch\.com' : 'goodsearch', 'kvasir\.' : 'kvasir', '\.accoona\.com' : 'accoona', '\.soso\.com' : 'soso', 'as\.starware\.com' : 'comettoolbar', 'virgilio\.it' : 'virgilio', 'o2\.pl' : 'o2pl', 'chello\.nl' : 'chellonl', 'chello\.be' : 'chellobe', 'icq\.com\/search' : 'icq', 'msn\.' : 'msn', 'fireball\.de' : 'fireball', 'sucheaol\.aol\.de' : 'aolde', 'uk\.ask.\com' : 'askuk', 'euroseek\.' : 'euroseek', 'gery\.pl' : 'gerypl', 'chello\.fr' : 'chellofr', 'netsprint\.pl' : 'netsprintpl', 'avantfind\.com' : 'avantfind', 'supereva\.com' : 'supereva', 'polymeta\.hu' : 'polymeta_hu', 'infospace\.com' : 'infospace', 'sify\.com' : 'sify', 'go2net\.com' : 'go2net', 'wahoo\.hu' : 'wahoo', 'suche\d?\.web\.de' : 'webde', '(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)' : 'metacrawler_de', '\.3721\.com' : '3721', 'ilse\.' : 'ilse', 'metacrawler\.' : 'metacrawler', 'sagool\.jp' : 'sagool', 'atlas\.cz' : 'atlas', 'vindex\.' : 'vindex', 'ixquick\.com' : 'ixquick', '66\.102\.[1-9]\.104' : 'google_cache', 'rambler\.ru' : 'rambler', 'answerbus\.com' : 'answerbus', 'evreka\.passagen\.se' : 'passagen', 'chello\.se' : 'chellose', 'clusty\.com' : 'clusty', 'search\.ch' : 'searchch', 'chello\.no' : 'chellono', 'searchalot\.com' : 'searchalot', 'questionanswering\.com' : 'questionanswering', 'seznam\.cz' : 'seznam', 'ukindex\.co\.uk' : 'ukindex', 'dmoz\.org' : 'dmoz', 'excite\.' : 'excite', 'chello\.pl' : 'chellopl', 'looksmart\.' : 'looksmart', '1klik\.dk' : '1klik', '\.vnet\.cn' : 'vnet', 'chello\.sk' : 'chellosk', '(^|\.)go\.com' : 'go', 'nusearch\.com' : 'nusearch', 'it\.ask.\com' : 'askit', 'bungeebonesdotcom' : 'bungeebonesdotcom', 'search\.terra\.' : 'terra', 'webcrawler\.' : 'webcrawler', 'suchen\.abacho\.de' : 'abacho', 'szukacz\.pl' : 'szukaczpl', '66\.249\.93\.104' : 'google_cache', 'search\.internetto\.hu' : 'internetto', 'goggle\.co\.hu' : 'google', 'mirago\.se' : 'miragose', 'images\.google\.' : 'google_image', 'segnalo\.alice\.it' : 'segnalo', '\.163\.com' : 'netease', 'chello' : 'chellocom'} +search_engines_hashid = {'live\.com' : 'live', 'lapkereso\.hu' : 'lapkereso', 'goodsearch\.com' : 'goodsearch', 'dogpile\.com' : 'dogpile', 'biglotron\.com' : 'biglotron', 'search\.internetto\.hu' : 'internetto', '66\.102\.[1-9]\.104' : 'google_cache', 'gery\.pl' : 'gerypl', 'search\.aol\.co' : 'aol', 'chello\.no' : 'chellono', '(^|\.)ask\.co\.uk' : 'askuk', 'ofir\.dk' : 'ofir', 'claro-search\.com' : 'clarosearch', 'chello\.nl' : 'chellonl', '\.soso\.com' : 'soso', 'gazeta\.pl' : 'gazetapl', 'danielsen\.com' : 'danielsen', 'rambler\.ru' : 'rambler', 'es\.ask.\com' : 'askes', 'mirago\.fr' : 'miragofr', 'search[\w\-]+\.free\.fr' : 'free', 'recherche\.aol\.fr' : 'aolfr', 'findarticles\.com' : 'findarticles', 'ask\.jp' : 'askjp', 'nl\.ask.\com' : 'asknl', 'base\.google\.' : 'google_base', 'ixquick\.com' : 'ixquick', 'search\..*\.\w+' : 'search', 'euroseek\.' : 'euroseek', 'o2\.pl' : 'o2pl', 'mirago' : 'mirago', 'overture\.com' : 'overture', 'teecno\.it' : 'teecnoit', 'att\.net' : 'att', 'find\.dk' : 'finddk', 'szukaj\.onet\.pl' : 'onetpl', 'vindex\.' : 'vindex', 'search\.alice\.it\.master' : 'aliceitmaster', 'clusty\.com' : 'clusty', 'static\.flipora\.com' : 'flipora', 'googlee\.' : 'google', 'metabot\.ru' : 'metabot', 'mirago\.co\.uk' : 'miragocouk', 'segnalo\.alice\.it' : 'segnalo', 'steady-search\.com' : 'steadysearch', 'ukindex\.co\.uk' : 'ukindex', '(^|\.)go\.com' : 'go', 'ukdirectory\.' : 'ukdirectory', 'voila\.' : 'voila', 'netluchs\.de' : 'netluchs', 'metacrawler\.' : 'metacrawler', 'engine\.exe' : 'engine', 'suche\d?\.web\.de' : 'webde', 'search\.ch' : 'searchch', 'search\.fbdownloader\.com' : 'fbdownloader', 'meinestadt\.de' : 'meinestadt', 'wow\.pl' : 'wowpl', 'alexa\.com' : 'alexa', 'francite\.' : 'francite', 'kartoo\.com' : 'kartoo', 'mirago\.nl' : 'miragonl', 'rechercher\.libertysurf\.fr' : 'libertysurf', '66\.249\.93\.104' : 'google_cache', 'excite\.' : 'excite', 'mirago\.it' : 'miragoit', 'redbox\.cz' : 'redbox', 'bbc\.co\.uk/cgi-bin/search' : 'bbc', 'mirago\.ch' : 'miragoch', 'tyfon\.dk' : 'tyfon', 'looksmart\.' : 'looksmart', 'ilse\.' : 'ilse', 'ineffabile\.it' : 'ineffabile', 'eniro\.se' : 'enirose', 'looksmart\.co\.uk' : 'looksmartuk', 'vizsla\.origo\.hu' : 'origo', 'google\.' : 'google', 'stumbleupon\.com' : 'stumbleupon', 'www\.holasearch\.com' : 'holasearch', 'webcrawler\.' : 'webcrawler', 'mozbot\.fr' : 'mozbot', 'vivisimo\.com' : 'vivisimo', 'virgilio\.it' : 'virgilio', 'jyxo\.(cz|com)' : 'jyxo', 'iask\.com' : 'iask', 'avantfind\.com' : 'avantfind', 'suchen\.abacho\.de' : 'abacho', 'mywebsearch\.com' : 'mywebsearch', 'zoznam\.sk' : 'zoznam', '(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)' : 'metacrawler_de', 'jubii\.dk' : 'jubii', 'katalog\.onet\.pl' : 'katalogonetpl', 'opasia\.dk' : 'opasia', 'godado' : 'godado', 'search\.genieo\.com' : 'genieo', 'bungeebonesdotcom' : 'bungeebonesdotcom', '216\.239\.(35|37|39|51)\.100' : 'google_cache', '(^|\.)ask\.com' : 'ask', 'anzwers\.com\.au' : 'anzwers', 'goliat\.hu' : 'goliat', 'mamma\.' : 'mamma', 'it\.ask.\com' : 'askit', 'search\.earthlink\.net' : 'earthlink', '\.lbb\.org' : 'lbb', 'aport\.ru' : 'aport', 'www\.search\.com' : 'search.com', 'jumpy\.it' : 'jumpy\.it', 'quick\.cz' : 'quick', 'webmania\.hu' : 'webmania', 'ya(ndex)?\.ru' : 'yandex', 'suche\.aol\.de' : 'aolsuche', 'start\.shaw\.ca' : 'shawca', 'lycos\.' : 'lycos', 'sol\.dk' : 'sol', 'dodaj\.pl' : 'dodajpl', 'go2net\.com' : 'go2net', 'start\.iminent\.com' : 'iminent', 'ledix\.net' : 'ledix', '\.3721\.com' : '3721', 'alltheweb\.com' : 'alltheweb', 'blingo\.com' : 'blingo', 'search\.babylon\.com' : 'babylon', 'as\.starware\.com' : 'comettoolbar', 'mysearch\.' : 'mysearch', 'googlecom\.com' : 'google', '\.zhongsou\.com' : 'zhongsou', 'questionanswering\.com' : 'questionanswering', 'wwweasel\.de' : 'wwweasel', '212\.227\.33\.241' : 'metaspinner', 'orbis\.dk' : 'orbis', 'netsprint\.pl' : 'netsprintpl', 'del\.icio\.us' : 'delicious', 'tiscali\.' : 'tiscali', 'chello\.sk' : 'chellosk', '\.163\.com' : 'netease', '(66\.218\.71\.225|216\.109\.117\.135|216\.109\.125\.130|66\.218\.69\.11)' : 'yahoo', 'nusearch\.com' : 'nusearch', 'netstjernen\.dk' : 'netstjernen', 'centraldatabase\.org' : 'centraldatabase', 'copernic\.com' : 'copernic', 'arianna\.libero\.it' : 'arianna', 'msn\.' : 'msn', '1klik\.dk' : '1klik', 'mindset\.research\.yahoo' : 'yahoo_mindset', 'yahoo\.' : 'yahoo', 'digg\.com' : 'digg', 'searchy\.co\.uk' : 'searchy', 'www1\.search-results\.com' : 'searchresults', 'heureka\.hu' : 'heureka', 'kvasir\.' : 'kvasir', 'ecosia\.org' : 'ecosiasearch', 'sphere\.com' : 'sphere', 'turtle\.ru' : 'turtle', 'wisenut\.com' : 'wisenut', 'index\.hu' : 'indexhu', '[a-z]serv\.rrzn\.uni-hannover\.de' : 'meta', 'www\.benefind\.de' : 'benefind', 'google\.[\w.]+/products' : 'google_products', 'keresolap\.hu' : 'keresolap_hu', 'ctrouve\.' : 'ctrouve', 'sify\.com' : 'sify', 'szukaj\.wp\.pl' : 'wp', 'icq\.com\/search' : 'icq', 'chello\.be' : 'chellobe', 'icerocket\.com' : 'icerocket', 'northernlight\.' : 'northernlight', 'netsprint\.pl\/hoga\-search' : 'hogapl', 'mirago\.se' : 'miragose', 'dmoz\.org' : 'dmoz', 'dejanews\.' : 'dejanews', '72\.14\.2[0-9]{2}\.104' : 'google_cache', 'polska\.pl' : 'polskapl', 'chello\.hu' : 'chellohu', '\.baidu\.com' : 'baidu', 'steadysearch\.com' : 'steadysearch', 'hotbot\.' : 'hotbot', 'sagool\.jp' : 'sagool', 'centrum\.cz' : 'centrum', 'de\.ask.\com' : 'askde', 'swik\.net' : 'swik', '(brisbane|suche)\.t-online\.de' : 't-online', '\.accoona\.com' : 'accoona', 'i-une\.com' : 'iune', 'www\.searchmobileonline\.com' : 'searchmobileonline', 'infoseek\.de' : 'infoseek', 'groups\.google\.' : 'google_groups', 'atlas\.cz' : 'atlas', 'najdi\.to' : 'najdi', 'fr\.ask.\com' : 'askfr', '216\.239\.(35|37|39|51)\.101' : 'google_cache', 'searchalot\.com' : 'searchalot', 'search\.conduit\.com' : 'conduit', 'spray\.' : 'spray', 'interia\.pl' : 'interiapl', 'spotjockey\.' : 'spotjockey', 'chello\.at' : 'chelloat', 'infospace\.com' : 'infospace', '(?:www[12]?|mixidj)\.delta-search\.com' : 'delta-search', 'chello' : 'chellocom', 'chello\.cz' : 'chellocz', 'mirago\.de' : 'miragode', '216\.239\.5[0-9]\.104' : 'google_cache', '4\-counter\.com' : 'google4counter', 'pogodak\.' : 'pogodak', 'uk\.ask.\com' : 'askuk', 'sok\.start\.no' : 'start', 'ifind\.freeserve' : 'freeserve', 'eniro\.no' : 'eniro', 'isearch\.avg\.com' : 'avgsearch', 'netscape\.' : 'netscape', 'sapo\.pt' : 'sapo', 'bing\.' : 'bing', 'search\.alice\.it' : 'aliceit', 'polymeta\.hu' : 'polymeta_hu', 'gotuneed\.com' : 'gotuneed', 'a9\.com' : 'a9', 'answerbus\.com' : 'answerbus', 'int\.search-results\.com' : 'nortonsavesearch', 'atomz\.' : 'atomz', 'sucheaol\.aol\.de' : 'aolde', 'allesklar\.de' : 'allesklar', 'es\.mirago\.com' : 'miragoes', 'szukacz\.pl' : 'szukaczpl', 'chello\.pl' : 'chellopl', 'de\.aolsearch\.com' : 'aolsearch', 'mirago\.be' : 'miragobe', '\.sogou\.com' : 'sogou', 'suche\.gmx\.net' : 'gmxsuche', '\.vnet\.cn' : 'vnet', 'toile\.com' : 'toile', 'search\.sli\.sympatico\.ca' : 'sympatico', 'search\.bluewin\.ch' : 'bluewin', 'o2suche\.aol\.de' : 'o2aolde', 'scroogle\.org' : 'scroogle', 'no\.mirago\.com' : 'miragono', '64\.233\.1[0-9]{2}\.104' : 'google_cache', 'miner\.bol\.com\.br' : 'miner', 'search\.terra\.' : 'terra', 'seznam\.cz' : 'seznam', 'chello\.fr' : 'chellofr', 'wahoo\.hu' : 'wahoo', 'splut\.' : 'splut', 'kataweb\.it' : 'kataweb', 'teoma\.' : 'teoma', 'www\.startxxl\.com' : 'startxxl', 'ukplus\.' : 'ukplus', 'mirago\.dk' : 'miragodk', 'goggle\.co\.hu' : 'google', 'haku\.www\.fi' : 'haku', 'schoenerbrausen\.de' : 'schoenerbrausen', 'altavista\.' : 'altavista', 'nbci\.com\/search' : 'nbci', 'edderkoppen\.dk' : 'edderkoppen', 'chello\.se' : 'chellose', 'tango\.hu' : 'tango_hu', 'recherche\.club-internet\.fr' : 'clubinternet', 'supereva\.com' : 'supereva', 'fireball\.de' : 'fireball', 'froogle\.google\.' : 'google_froogle', 'images\.google\.' : 'google_image', 'evreka\.passagen\.se' : 'passagen', 'shinyseek\.it' : 'shinyseek\.it'} -search_engines_knwown_url = {'dmoz' : 'search=', 'google' : '(p|q|as_p|as_q)=', 'searchalot' : 'q=', 'teoma' : 'q=', 'looksmartuk' : 'key=', 'polymeta_hu' : '', 'google_groups' : 'group\/', 'iune' : '(keywords|q)=', 'chellosk' : 'q1=', 'eniro' : 'q=', 'msn' : 'q=', 'webcrawler' : 'searchText=', 'mirago' : '(txtsearch|qry)=', 'enirose' : 'q=', 'miragobe' : '(txtsearch|qry)=', 'netease' : 'q=', 'netluchs' : 'query=', 'google_products' : '(p|q|as_p|as_q)=', 'jyxo' : '(s|q)=', 'origo' : '(q|search)=', 'ilse' : 'search_for=', 'chellocom' : 'q1=', 'goodsearch' : 'Keywords=', 'ledix' : 'q=', 'mozbot' : 'q=', 'chellocz' : 'q1=', 'webde' : 'su=', 'biglotron' : 'question=', 'metacrawler_de' : 'qry=', 'finddk' : 'words=', 'start' : 'q=', 'sagool' : 'q=', 'miragoch' : '(txtsearch|qry)=', 'google_base' : '(p|q|as_p|as_q)=', 'aliceit' : 'qs=', 'shinyseek\.it' : 'KEY=', 'onetpl' : 'qt=', 'clusty' : 'query=', 'chellonl' : 'q1=', 'miragode' : '(txtsearch|qry)=', 'miragose' : '(txtsearch|qry)=', 'o2pl' : 'qt=', 'goliat' : 'KERESES=', 'kvasir' : 'q=', 'askfr' : '(ask|q)=', 'infoseek' : 'qt=', 'yahoo_mindset' : 'p=', 'comettoolbar' : 'qry=', 'alltheweb' : 'q(|uery)=', 'miner' : 'q=', 'aol' : 'query=', 'rambler' : 'words=', 'scroogle' : 'Gw=', 'chellose' : 'q1=', 'ineffabile' : '', 'miragoit' : '(txtsearch|qry)=', 'yandex' : 'text=', 'segnalo' : '', 'dodajpl' : 'keyword=', 'avantfind' : 'keywords=', 'nusearch' : 'nusearch_terms=', 'bbc' : 'q=', 'supereva' : 'q=', 'atomz' : 'sp-q=', 'searchy' : 'search_term=', 'dogpile' : 'q(|kw)=', 'chellohu' : 'q1=', 'vnet' : 'kw=', '1klik' : 'query=', 't-online' : 'q=', 'hogapl' : 'qt=', 'stumbleupon' : '', 'soso' : 'q=', 'zhongsou' : '(word|w)=', 'a9' : 'a9\.com\/', 'centraldatabase' : 'query=', 'mamma' : 'query=', 'icerocket' : 'q=', 'ask' : '(ask|q)=', 'chellobe' : 'q1=', 'altavista' : 'q=', 'vindex' : 'in=', 'miragodk' : '(txtsearch|qry)=', 'chelloat' : 'q1=', 'digg' : 's=', 'metacrawler' : 'general=', 'nbci' : 'keyword=', 'chellono' : 'q1=', 'icq' : 'q=', 'arianna' : 'query=', 'miragocouk' : '(txtsearch|qry)=', '3721' : '(p|name)=', 'pogodak' : 'q=', 'ukdirectory' : 'k=', 'overture' : 'keywords=', 'heureka' : 'heureka=', 'teecnoit' : 'q=', 'miragoes' : '(txtsearch|qry)=', 'haku' : 'w=', 'go' : 'qt=', 'fireball' : 'q=', 'wisenut' : 'query=', 'sify' : 'keyword=', 'ixquick' : 'query=', 'anzwers' : 'search=', 'quick' : 'query=', 'jubii' : 'soegeord=', 'questionanswering' : '', 'asknl' : '(ask|q)=', 'askde' : '(ask|q)=', 'att' : 'qry=', 'terra' : 'query=', 'bing' : 'q=', 'wowpl' : 'q=', 'freeserve' : 'q=', 'atlas' : '(searchtext|q)=', 'askuk' : '(ask|q)=', 'godado' : 'Keywords=', 'northernlight' : 'qr=', 'answerbus' : '', 'search.com' : 'q=', 'google_image' : '(p|q|as_p|as_q)=', 'jumpy\.it' : 'searchWord=', 'gazetapl' : 'slowo=', 'yahoo' : 'p=', 'hotbot' : 'mt=', 'metabot' : 'st=', 'copernic' : 'web\/', 'kartoo' : '', 'metaspinner' : 'qry=', 'toile' : 'q=', 'aolde' : 'q=', 'blingo' : 'q=', 'askit' : '(ask|q)=', 'netscape' : 'search=', 'splut' : 'pattern=', 'looksmart' : 'key=', 'sphere' : 'q=', 'sol' : 'q=', 'miragono' : '(txtsearch|qry)=', 'kataweb' : 'q=', 'ofir' : 'querytext=', 'aliceitmaster' : 'qs=', 'miragofr' : '(txtsearch|qry)=', 'spray' : 'string=', 'seznam' : '(w|q)=', 'interiapl' : 'q=', 'euroseek' : 'query=', 'schoenerbrausen' : 'q=', 'centrum' : 'q=', 'netsprintpl' : 'q=', 'go2net' : 'general=', 'katalogonetpl' : 'qt=', 'ukindex' : 'stext=', 'shawca' : 'q=', 'szukaczpl' : 'q=', 'accoona' : 'qt=', 'live' : 'q=', 'google4counter' : '(p|q|as_p|as_q)=', 'iask' : '(w|k)=', 'earthlink' : 'q=', 'tiscali' : 'key=', 'askes' : '(ask|q)=', 'gotuneed' : '', 'clubinternet' : 'q=', 'redbox' : 'srch=', 'delicious' : 'all=', 'chellofr' : 'q1=', 'lycos' : 'query=', 'sympatico' : 'query=', 'vivisimo' : 'query=', 'bluewin' : 'qry=', 'mysearch' : 'searchfor=', 'google_cache' : '(p|q|as_p|as_q)=cache:[0-9A-Za-z]{12}:', 'ukplus' : 'search=', 'gerypl' : 'q=', 'keresolap_hu' : 'q=', 'abacho' : 'q=', 'engine' : 'p1=', 'opasia' : 'q=', 'wp' : 'szukaj=', 'steadysearch' : 'w=', 'chellopl' : 'q1=', 'voila' : '(kw|rdata)=', 'aport' : 'r=', 'internetto' : 'searchstr=', 'passagen' : 'q=', 'wwweasel' : 'q=', 'najdi' : 'dotaz=', 'alexa' : 'q=', 'baidu' : '(wd|word)=', 'spotjockey' : 'Search_Keyword=', 'virgilio' : 'qs=', 'orbis' : 'search_field=', 'tango_hu' : 'q=', 'askjp' : '(ask|q)=', 'bungeebonesdotcom' : 'query=', 'francite' : 'name=', 'searchch' : 'q=', 'google_froogle' : '(p|q|as_p|as_q)=', 'excite' : 'search=', 'infospace' : 'qkw=', 'polskapl' : 'qt=', 'swik' : 'swik\.net/', 'edderkoppen' : 'query=', 'mywebsearch' : 'searchfor=', 'danielsen' : 'q=', 'wahoo' : 'q=', 'sogou' : 'query=', 'miragonl' : '(txtsearch|qry)=', 'findarticles' : 'key='} +search_engines_knwown_url = {'mysearch' : 'searchfor=', 'webde' : 'su=', 'chellose' : 'q1=', 'teecnoit' : 'q=', 'chellopl' : 'q1=', 'engine' : 'p1=', 'abacho' : 'q=', 'toile' : 'q=', 'internetto' : 'searchstr=', 'searchalot' : 'q=', 'teoma' : 'q=', 'rambler' : 'words=', 'att' : 'qry=', 'questionanswering' : '', 'netsprintpl' : 'q=', 'clarosearch' : 'q=', 'yahoo_mindset' : 'p=', 'interiapl' : 'q=', 'chellonl' : 'q1=', 'iask' : '(w|k)=', 'freeserve' : 'q=', 'swik' : 'swik\.net/', 'avgsearch' : 'q=', 'start' : 'q=', 'yahoo' : 'p=', 'netease' : 'q=', 'mirago' : '(txtsearch|qry)=', 'eniro' : 'q=', 'excite' : 'search=', 'searchch' : 'q=', 'findarticles' : 'key=', 'icerocket' : 'q=', 'a9' : 'a9\.com\/', 'miragose' : '(txtsearch|qry)=', 'miragoes' : '(txtsearch|qry)=', 'live' : 'q=', 'miragoit' : '(txtsearch|qry)=', 'enirose' : 'q=', 'fbdownloader' : 'q=', 'katalogonetpl' : 'qt=', 'voila' : '(kw|rdata)=', 'ixquick' : 'query=', 'iminent' : 'q=', 'passagen' : 'q=', 'copernic' : 'web\/', 'startxxl' : 'q=', 'google4counter' : '(p|q|as_p|as_q)=', 'vivisimo' : 'query=', 'wisenut' : 'query=', 'delta-search' : 'q=', 'quick' : 'query=', 'miragobe' : '(txtsearch|qry)=', 'baidu' : '(wd|word)=', 'tango_hu' : 'q=', 'supereva' : 'q=', 'jumpy\.it' : 'searchWord=', 'benefind' : 'q=', 'arianna' : 'query=', 'miragode' : '(txtsearch|qry)=', 'earthlink' : 'q=', 'finddk' : 'words=', 'search.com' : 'q=', 'seznam' : '(w|q)=', 'nusearch' : 'nusearch_terms=', 'ukdirectory' : 'k=', 'chellono' : 'q1=', 'ineffabile' : '', 'looksmart' : 'key=', 'metaspinner' : 'qry=', 'hotbot' : 'mt=', 'mywebsearch' : 'searchfor=', 'polymeta_hu' : '', 'steadysearch' : 'w=', 'sagool' : 'q=', 'francite' : 'name=', 'accoona' : 'qt=', 'nbci' : 'keyword=', 'soso' : 'q=', 'euroseek' : 'query=', 'iune' : '(keywords|q)=', 'spray' : 'string=', 'comettoolbar' : 'qry=', 'edderkoppen' : 'query=', 'gotuneed' : '', 'chellocz' : 'q1=', 'vnet' : 'kw=', 'kartoo' : '', 'askfr' : '(ask|q)=', 'chellohu' : 'q1=', 'metabot' : 'st=', 'lycos' : 'query=', 'bbc' : 'q=', 'shawca' : 'q=', 'jyxo' : '(s|q)=', 'netscape' : 'search=', 'godado' : 'Keywords=', 'wowpl' : 'q=', 'clubinternet' : 'q=', 'najdi' : 'dotaz=', 'bungeebonesdotcom' : 'query=', 'ecosiasearch' : 'q=', 'redbox' : 'srch=', 'ukplus' : 'search=', 'polskapl' : 'qt=', 'aol' : 'query=', 'origo' : '(q|search)=', 'yandex' : 'text=', 't-online' : 'q=', 'miragodk' : '(txtsearch|qry)=', '1klik' : 'query=', 'chellobe' : 'q1=', 'askes' : '(ask|q)=', 'go2net' : 'general=', 'atomz' : 'sp-q=', 'stumbleupon' : '', 'answerbus' : '', 'miragofr' : '(txtsearch|qry)=', 'miragoch' : '(txtsearch|qry)=', 'google_base' : '(p|q|as_p|as_q)=', 'sify' : 'keyword=', '3721' : '(p|name)=', 'zhongsou' : '(word|w)=', 'gerypl' : 'q=', 'delicious' : 'all=', 'opasia' : 'q=', 'go' : 'qt=', 'segnalo' : '', 'askde' : '(ask|q)=', 'asknl' : '(ask|q)=', 'netluchs' : 'query=', 'flipora' : 'q=', 'haku' : 'w=', 'aolsearch' : 'q=', 'onetpl' : 'qt=', 'holasearch' : 'q=', 'schoenerbrausen' : 'q=', 'chellofr' : 'q1=', 'google_froogle' : '(p|q|as_p|as_q)=', 'miragocouk' : '(txtsearch|qry)=', 'dodajpl' : 'keyword=', 'aport' : 'r=', 'kataweb' : 'q=', 'anzwers' : 'search=', 'centraldatabase' : 'query=', 'szukaczpl' : 'q=', 'northernlight' : 'qr=', 'alltheweb' : 'q(|uery)=', 'infoseek' : 'qt=', 'msn' : 'q=', 'digg' : 's=', 'virgilio' : 'qs=', 'google_products' : '(p|q|as_p|as_q)=', 'danielsen' : 'q=', 'miner' : 'q=', 'ofir' : 'querytext=', 'sympatico' : 'query=', 'searchmobileonline' : 'q=', 'metacrawler' : 'general=', 'sol' : 'q=', 'altavista' : 'q=', 'miragono' : '(txtsearch|qry)=', 'sphere' : 'q=', 'looksmartuk' : 'key=', 'aolsuche' : 'q=', 'fireball' : 'q=', 'askjp' : '(ask|q)=', 'nortonsavesearch' : 'q=', 'genieo' : 'q=', 'dmoz' : 'search=', 'searchy' : 'search_term=', 'chellocom' : 'q1=', 'infospace' : 'qkw=', 'centrum' : 'q=', 'alexa' : 'q=', 'goodsearch' : 'Keywords=', 'ukindex' : 'stext=', 'conduit' : 'q=', 'wwweasel' : 'q=', 'dogpile' : 'q(|kw)=', 'overture' : 'keywords=', 'google_image' : '(p|q|as_p|as_q)=', 'google' : '(p|q|as_p|as_q)=', 'o2aolde' : 'q=', 'keresolap_hu' : 'q=', 'icq' : 'q=', 'spotjockey' : 'Search_Keyword=', 'bing' : 'q=', 'shinyseek\.it' : 'KEY=', 'orbis' : 'search_field=', 'goliat' : 'KERESES=', 'ilse' : 'search_for=', 'google_groups' : 'group\/', 'chelloat' : 'q1=', 'metacrawler_de' : 'qry=', 'searchresults' : 'q=', 'askit' : '(ask|q)=', 'miragonl' : '(txtsearch|qry)=', 'scroogle' : 'Gw=', 'terra' : 'query=', 'jubii' : 'soegeord=', 'wp' : 'szukaj=', 'chellosk' : 'q1=', 'babylon' : 'q=', 'vindex' : 'in=', 'aolde' : 'q=', 'sogou' : 'query=', 'aliceit' : 'qs=', 'kvasir' : 'q=', 'aliceitmaster' : 'qs=', 'o2pl' : 'qt=', 'biglotron' : 'question=', 'blingo' : 'q=', 'avantfind' : 'keywords=', 'mozbot' : 'q=', 'splut' : 'pattern=', 'atlas' : '(searchtext|q)=', 'google_cache' : '(p|q|as_p|as_q)=cache:[0-9A-Za-z]{12}:', 'ledix' : 'q=', 'bluewin' : 'qry=', 'clusty' : 'query=', 'pogodak' : 'q=', 'webcrawler' : 'searchText=', 'hogapl' : 'qt=', 'wahoo' : 'q=', 'gmxsuche' : 'q=', 'ask' : '(ask|q)=', 'gazetapl' : 'slowo=', 'heureka' : 'heureka=', 'tiscali' : 'key=', 'askuk' : '(ask|q)=', 'mamma' : 'query='} -operating_systems = ['windows[_+ ]?2005', 'windows[_+ ]nt[_+ ]6\.0', 'windows[_+ ]?2008', 'windows[_+ ]nt[_+ ]6\.1', 'windows[_+ ]?vista', 'windows[_+ ]nt[_+ ]6', 'windows[_+ ]?2003', 'windows[_+ ]nt[_+ ]5\.2', 'windows[_+ ]xp', 'windows[_+ ]nt[_+ ]5\.1', 'windows[_+ ]me', 'win[_+ ]9x', 'windows[_+ ]?2000', 'windows[_+ ]nt[_+ ]5', 'winnt', 'windows[_+ \-]?nt', 'win32', 'win(.*)98', 'win(.*)95', 'win(.*)16', 'windows[_+ ]3', 'win(.*)ce', 'mac[_+ ]os[_+ ]x', 'mac[_+ ]?p', 'mac[_+ ]68', 'macweb', 'macintosh', 'linux(.*)android', 'linux(.*)asplinux', 'linux(.*)centos', 'linux(.*)debian', 'linux(.*)fedora', 'linux(.*)gentoo', 'linux(.*)mandr', 'linux(.*)momonga', 'linux(.*)pclinuxos', 'linux(.*)red[_+ ]hat', 'linux(.*)suse', 'linux(.*)ubuntu', 'linux(.*)vector', 'linux(.*)vine', 'linux(.*)white\sbox', 'linux(.*)zenwalk', 'linux', 'gnu.hurd', 'bsdi', 'gnu.kfreebsd', 'freebsd', 'openbsd', 'netbsd', 'dragonfly', 'aix', 'sunos', 'irix', 'osf', 'hp\-ux', 'unix', 'x11', 'gnome\-vfs', 'beos', 'os/2', 'amiga', 'atari', 'vms', 'commodore', 'qnx', 'inferno', 'palmos', 'syllable', 'blackberry', 'cp/m', 'crayos', 'dreamcast', 'iphone[_+ ]os', 'risc[_+ ]?os', 'symbian', 'webtv', 'playstation', 'xbox', 'wii', 'vienna', 'newsfire', 'applesyndication', 'akregator', 'plagger', 'syndirella', 'j2me', 'java', 'microsoft', 'msie[_+ ]', 'ms[_+ ]frontpage', 'windows'] +operating_systems = ['windows[_+ ]?2005', 'windows[_+ ]nt[_+ ]6\.0', 'windows[_+ ]?2008', 'windows[_+ ]nt[_+ ]6\.1', 'windows[_+ ]?2012', 'windows[_+ ]nt[_+ ]6\.2', 'windows[_+ ]?vista', 'windows[_+ ]nt[_+ ]6', 'windows[_+ ]?2003', 'windows[_+ ]nt[_+ ]5\.2', 'windows[_+ ]xp', 'windows[_+ ]nt[_+ ]5\.1', 'windows[_+ ]me', 'win[_+ ]9x', 'windows[_+ ]?2000', 'windows[_+ ]nt[_+ ]5', 'winnt', 'windows[_+ \-]?nt', 'win32', 'win(.*)98', 'win(.*)95', 'win(.*)16', 'windows[_+ ]3', 'win(.*)ce', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]9', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]8', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]7', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]6', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]5', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]4', 'mac[_+ ]os[_+ ]x', 'mac[_+ ]?p', 'mac[_+ ]68', 'macweb', 'macintosh', 'linux(.*)android', 'linux(.*)asplinux', 'linux(.*)centos', 'linux(.*)debian', 'linux(.*)fedora', 'linux(.*)gentoo', 'linux(.*)mandr', 'linux(.*)momonga', 'linux(.*)pclinuxos', 'linux(.*)red[_+ ]hat', 'linux(.*)suse', 'linux(.*)ubuntu', 'linux(.*)vector', 'linux(.*)vine', 'linux(.*)white\sbox', 'linux(.*)zenwalk', 'linux', 'gnu.hurd', 'bsdi', 'gnu.kfreebsd', 'freebsd', 'openbsd', 'netbsd', 'dragonfly', 'aix', 'sunos', 'irix', 'osf', 'hp\-ux', 'unix', 'x11', 'gnome\-vfs', 'beos', 'os/2', 'amiga', 'atari', 'vms', 'commodore', 'qnx', 'inferno', 'palmos', 'syllable', 'blackberry', 'cp/m', 'crayos', 'dreamcast', 'iphone[_+ ]os', 'risc[_+ ]?os', 'symbian', 'webtv', 'playstation', 'xbox', 'wii', 'vienna', 'newsfire', 'applesyndication', 'akregator', 'plagger', 'syndirella', 'j2me', 'java', 'microsoft', 'msie[_+ ]', 'ms[_+ ]frontpage', 'windows'] -operating_systems_hashid = {'crayos' : 'crayos', 'linux(.*)white\sbox' : 'linuxwhitebox', 'windows[_+ \-]?nt' : 'winnt', 'windows[_+ ]?2003' : 'win2003', 'mac[_+ ]?p' : 'macintosh', 'netbsd' : 'bsdnetbsd', 'win[_+ ]9x' : 'winme', 'vms' : 'vms', 'gnome\-vfs' : 'unix', 'windows[_+ ]nt[_+ ]5' : 'win2000', 'windows[_+ ]nt[_+ ]6\.0' : 'winlong', 'dragonflybsd' : 'bsddflybsd', 'wii' : 'wii', 'linux(.*)vector' : 'linuxvector', 'microsoft' : 'winunknown', 'plagger' : 'unix', 'amiga' : 'amigaos', 'windows[_+ ]me' : 'winme', 'irix' : 'irix', 'linux(.*)android' : 'linuxandroid', 'linux(.*)suse' : 'linuxsuse', 'java' : 'java', 'win(.*)ce' : 'wince', 'cp/m' : 'cp/m', 'windows[_+ ]3' : 'win16', 'win(.*)98' : 'win98', 'windows' : 'winunknown', 'os/2' : 'os/2', 'syndirella' : 'winxp', 'osf' : 'osf', 'macweb' : 'macintosh', 'linux(.*)centos' : 'linuxcentos', 'gnu.hurd' : 'gnu', 'dreamcast' : 'dreamcast', 'linux' : 'linux', 'win(.*)16' : 'win16', 'freebsd' : 'bsdfreebsd', 'windows[_+ ]xp' : 'winxp', 'blackberry' : 'blackberry', 'macintosh' : 'macintosh', 'symbian' : 'symbian', 'linux(.*)debian' : 'linuxdebian', 'windows[_+ ]?2005' : 'winlong', 'linux(.*)red[_+ ]hat' : 'linuxredhat', 'x11' : 'unix', 'windows[_+ ]nt[_+ ]5\.2' : 'win2003', 'j2me' : 'j2me', 'sunos' : 'sunos', 'linux(.*)vine' : 'linuxvine', 'mac[_+ ]os[_+ ]x' : 'macosx', 'unix' : 'unix', 'windows[_+ ]?2000' : 'win2000', 'inferno' : 'inferno', 'aix' : 'aix', 'akregator' : 'linux', 'atari' : 'atari', 'linux(.*)asplinux' : 'linuxasplinux', 'linux(.*)ubuntu' : 'linuxubuntu', 'win(.*)95' : 'win95', 'xbox' : 'winxbox', 'applesyndication' : 'macosx', 'risc[_+ ]?os' : 'riscos', 'playstation' : 'psp', 'winnt' : 'winnt', 'windows[_+ ]nt[_+ ]5\.1' : 'winxp', 'palmos' : 'palmos', 'windows[_+ ]nt[_+ ]6\.1' : 'win7', 'syllable' : 'syllable', 'commodore' : 'commodore', 'vienna' : 'macosx', 'linux(.*)gentoo' : 'linuxgentoo', 'hp\-ux' : 'hp\-ux', 'linux(.*)fedora' : 'linuxfedora', 'linux(.*)pclinuxos' : 'linuxpclinuxos', 'openbsd' : 'bsdopenbsd', 'windows[_+ ]nt[_+ ]6' : 'winvista', 'mac[_+ ]68' : 'macintosh', 'windows[_+ ]?vista' : 'winvista', 'newsfire' : 'macosx', 'windows[_+ ]?2008' : 'win2008', 'linux(.*)mandr' : 'linuxmandr', 'gnu.kfreebsd' : 'bsdkfreebsd', 'bsdi' : 'bsdi', 'win32' : 'winnt', 'webtv' : 'webtv', 'linux(.*)momonga' : 'linuxmomonga', 'msie[_+ ]' : 'winunknown', 'qnx' : 'qnx', 'iphone[_+ ]os' : 'ios', 'linux(.*)zenwalk' : 'linuxzenwalk', 'beos' : 'beos', 'ms[_+ ]frontpage' : 'winunknown'} +operating_systems_hashid = {'msie[_+ ]' : 'winunknown', 'gnu.hurd' : 'gnu', 'osf' : 'osf', 'windows[_+ ]?vista' : 'winvista', 'unix' : 'unix', 'windows[_+ ]3' : 'win16', 'windows[_+ ]nt[_+ ]5' : 'win2000', 'windows[_+ \-]?nt' : 'winnt', 'iphone[_+ ]os' : 'ios', 'linux(.*)vine' : 'linuxvine', 'vms' : 'vms', 'wii' : 'wii', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]7' : 'macosx7', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]6' : 'macosx6', 'ms[_+ ]frontpage' : 'winunknown', 'netbsd' : 'bsdnetbsd', 'linux(.*)fedora' : 'linuxfedora', 'playstation' : 'psp', 'dreamcast' : 'dreamcast', 'linux(.*)ubuntu' : 'linuxubuntu', 'win(.*)16' : 'win16', 'windows[_+ ]nt[_+ ]6\.1' : 'win7', 'linux(.*)red[_+ ]hat' : 'linuxredhat', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]8' : 'macosx8', 'beos' : 'beos', 'dragonflybsd' : 'bsddflybsd', 'linux(.*)zenwalk' : 'linuxzenwalk', 'symbian' : 'symbian', 'gnome\-vfs' : 'unix', 'windows[_+ ]nt[_+ ]5\.1' : 'winxp', 'windows[_+ ]nt[_+ ]6' : 'winvista', 'linux(.*)android' : 'linuxandroid', 'hp\-ux' : 'hp\-ux', 'irix' : 'irix', 'windows[_+ ]?2005' : 'winlong', 'webtv' : 'webtv', 'windows[_+ ]?2000' : 'win2000', 'windows[_+ ]nt[_+ ]6\.0' : 'winlong', 'win(.*)ce' : 'wince', 'macweb' : 'macintosh', 'linux(.*)white\sbox' : 'linuxwhitebox', 'atari' : 'atari', 'windows[_+ ]nt[_+ ]5\.2' : 'win2003', 'xbox' : 'winxbox', 'linux(.*)asplinux' : 'linuxasplinux', 'win(.*)95' : 'win95', 'bsdi' : 'bsdi', 'windows[_+ ]?2003' : 'win2003', 'crayos' : 'crayos', 'aix' : 'aix', 'win[_+ ]9x' : 'winme', 'windows[_+ ]?2008' : 'win2008', 'syllable' : 'syllable', 'vienna' : 'macosx', 'commodore' : 'commodore', 'winnt' : 'winnt', 'plagger' : 'unix', 'linux' : 'linux', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]5' : 'macosx5', 'newsfire' : 'macosx', 'linux(.*)vector' : 'linuxvector', 'mac[_+ ]68' : 'macintosh', 'mac[_+ ]?p' : 'macintosh', 'risc[_+ ]?os' : 'riscos', 'macintosh' : 'macintosh', 'windows[_+ ]?2012' : 'win2012', 'linux(.*)pclinuxos' : 'linuxpclinuxos', 'akregator' : 'linux', 'linux(.*)debian' : 'linuxdebian', 'sunos' : 'sunos', 'java' : 'java', 'syndirella' : 'winxp', 'linux(.*)suse' : 'linuxsuse', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]9' : 'macosx9', 'microsoft' : 'winunknown', 'win(.*)98' : 'win98', 'x11' : 'unix', 'windows[_+ ]me' : 'winme', 'linux(.*)mandr' : 'linuxmandr', 'qnx' : 'qnx', 'mac[_+ ]os[_+ ]x[_+ ]10[_\.]4' : 'macosx4', 'linux(.*)momonga' : 'linuxmomonga', 'cp/m' : 'cp/m', 'win32' : 'winnt', 'blackberry' : 'blackberry', 'applesyndication' : 'macosx', 'os/2' : 'os/2', 'windows[_+ ]xp' : 'winxp', 'mac[_+ ]os[_+ ]x' : 'macosx', 'linux(.*)gentoo' : 'linuxgentoo', 'inferno' : 'inferno', 'j2me' : 'j2me', 'gnu.kfreebsd' : 'bsdkfreebsd', 'windows[_+ ]nt[_+ ]6\.2' : 'win8', 'amiga' : 'amigaos', 'openbsd' : 'bsdopenbsd', 'windows' : 'winunknown', 'palmos' : 'palmos', 'freebsd' : 'bsdfreebsd', 'linux(.*)centos' : 'linuxcentos'} -operating_systems_family = {'mac' : 'Macintosh', 'linux' : 'Linux', 'bsd' : 'BSD', 'win' : 'Windows'} +operating_systems_family = {'mac' : 'Macintosh', 'linux' : 'Linux', 'win' : 'Windows', 'bsd' : 'BSD'} -browsers = ['elinks', 'firebird', 'go!zilla', 'icab', 'links', 'lynx', 'omniweb', '22acidownload', 'abrowse', 'aol\-iweng', 'amaya', 'amigavoyager', 'arora', 'aweb', 'charon', 'donzilla', 'seamonkey', 'flock', 'minefield', 'bonecho', 'granparadiso', 'songbird', 'strata', 'sylera', 'kazehakase', 'prism', 'icecat', 'iceape', 'iceweasel', 'w3clinemode', 'bpftp', 'camino', 'chimera', 'cyberdog', 'dillo', 'xchaos_arachne', 'doris', 'dreamcast', 'xbox', 'downloadagent', 'ecatch', 'emailsiphon', 'encompass', 'epiphany', 'friendlyspider', 'fresco', 'galeon', 'flashget', 'freshdownload', 'getright', 'leechget', 'netants', 'headdump', 'hotjava', 'ibrowse', 'intergo', 'k\-meleon', 'k\-ninja', 'linemodebrowser', 'lotus\-notes', 'macweb', 'multizilla', 'ncsa_mosaic', 'netcaptor', 'netpositive', 'nutscrape', 'msfrontpageexpress', 'contiki', 'emacs\-w3', 'phoenix', 'shiira', 'tzgeturl', 'viking', 'webfetcher', 'webexplorer', 'webmirror', 'webvcr', 'qnx\svoyager', 'teleport', 'webcapture', 'webcopier', 'real', 'winamp', 'windows\-media\-player', 'audion', 'freeamp', 'itunes', 'jetaudio', 'mint_audio', 'mpg123', 'mplayer', 'nsplayer', 'qts', 'quicktime', 'sonique', 'uplayer', 'xaudio', 'xine', 'xmms', 'gstreamer', 'abilon', 'aggrevator', 'aiderss', 'akregator', 'applesyndication', 'betanews_reader', 'blogbridge', 'cyndicate', 'feeddemon', 'feedreader', 'feedtools', 'greatnews', 'gregarius', 'hatena_rss', 'jetbrains_omea', 'liferea', 'netnewswire', 'newsfire', 'newsgator', 'newzcrawler', 'plagger', 'pluck', 'potu', 'pubsub\-rss\-reader', 'pulpfiction', 'rssbandit', 'rssreader', 'rssowl', 'rss\sxpress', 'rssxpress', 'sage', 'sharpreader', 'shrook', 'straw', 'syndirella', 'vienna', 'wizz\srss\snews\sreader', 'alcatel', 'lg\-', 'mot\-', 'nokia', 'panasonic', 'philips', 'sagem', 'samsung', 'sie\-', 'sec\-', 'sonyericsson', 'ericsson', 'mmef', 'mspie', 'vodafone', 'wapalizer', 'wapsilon', 'wap', 'webcollage', 'up\.', 'android', 'blackberry', 'cnf2', 'docomo', 'ipcheck', 'iphone', 'portalmmm', 'webtv', 'democracy', 'cjb\.net', 'ossproxy', 'smallproxy', 'adobeair', 'apt', 'analogx_proxy', 'gnome\-vfs', 'neon', 'curl', 'csscheck', 'httrack', 'fdm', 'javaws', 'wget', 'fget', 'chilkat', 'webdownloader\sfor\sx', 'w3m', 'wdg_validator', 'w3c_validator', 'jigsaw', 'webreaper', 'webzip', 'staroffice', 'gnus', 'nikto', 'download\smaster', 'microsoft\-webdav\-miniredir', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\scache\smanager', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sdav', 'POE\-Component\-Client\-HTTP', 'mozilla', 'libwww', 'lwp', 'WebSec'] +browsers = ['elinks', 'firebird', 'go!zilla', 'icab', 'links', 'lynx', 'omniweb', '22acidownload', 'abrowse', 'aol\-iweng', 'amaya', 'amigavoyager', 'arora', 'aweb', 'charon', 'donzilla', 'seamonkey', 'flock', 'minefield', 'bonecho', 'granparadiso', 'songbird', 'strata', 'sylera', 'kazehakase', 'prism', 'icecat', 'iceape', 'iceweasel', 'w3clinemode', 'bpftp', 'camino', 'chimera', 'cyberdog', 'dillo', 'xchaos_arachne', 'doris', 'dreamcast', 'xbox', 'downloadagent', 'ecatch', 'emailsiphon', 'encompass', 'epiphany', 'friendlyspider', 'fresco', 'galeon', 'flashget', 'freshdownload', 'getright', 'leechget', 'netants', 'headdump', 'hotjava', 'ibrowse', 'intergo', 'k\-meleon', 'k\-ninja', 'linemodebrowser', 'lotus\-notes', 'macweb', 'multizilla', 'ncsa_mosaic', 'netcaptor', 'netpositive', 'nutscrape', 'msfrontpageexpress', 'contiki', 'emacs\-w3', 'phoenix', 'shiira', 'tzgeturl', 'viking', 'webfetcher', 'webexplorer', 'webmirror', 'webvcr', 'qnx\svoyager', 'cloudflare', 'grabber', 'teleport', 'webcapture', 'webcopier', 'real', 'winamp', 'windows\-media\-player', 'audion', 'freeamp', 'itunes', 'jetaudio', 'mint_audio', 'mpg123', 'mplayer', 'nsplayer', 'qts', 'quicktime', 'sonique', 'uplayer', 'xaudio', 'xine', 'xmms', 'gstreamer', 'abilon', 'aggrevator', 'aiderss', 'akregator', 'applesyndication', 'betanews_reader', 'blogbridge', 'cyndicate', 'feeddemon', 'feedreader', 'feedtools', 'greatnews', 'gregarius', 'hatena_rss', 'jetbrains_omea', 'liferea', 'netnewswire', 'newsfire', 'newsgator', 'newzcrawler', 'plagger', 'pluck', 'potu', 'pubsub\-rss\-reader', 'pulpfiction', 'rssbandit', 'rssreader', 'rssowl', 'rss\sxpress', 'rssxpress', 'sage', 'sharpreader', 'shrook', 'straw', 'syndirella', 'vienna', 'wizz\srss\snews\sreader', 'alcatel', 'lg\-', 'mot\-', 'nokia', 'panasonic', 'philips', 'sagem', 'samsung', 'sie\-', 'sec\-', 'sonyericsson', 'ericsson', 'mmef', 'mspie', 'vodafone', 'wapalizer', 'wapsilon', 'wap', 'webcollage', 'up\.', 'android', 'blackberry', 'cnf2', 'docomo', 'ipcheck', 'iphone', 'portalmmm', 'webtv', 'democracy', 'cjb\.net', 'ossproxy', 'smallproxy', 'adobeair', 'apt', 'analogx_proxy', 'gnome\-vfs', 'neon', 'curl', 'csscheck', 'httrack', 'fdm', 'javaws', 'wget', 'fget', 'chilkat', 'webdownloader\sfor\sx', 'w3m', 'wdg_validator', 'w3c_validator', 'jigsaw', 'webreaper', 'webzip', 'staroffice', 'gnus', 'nikto', 'download\smaster', 'microsoft\-webdav\-miniredir', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\scache\smanager', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sdav', 'POE\-Component\-Client\-HTTP', 'mozilla', 'libwww', 'lwp', 'WebSec'] -browsers_hashid = {'jetbrains_omea' : 'Omea (RSS Reader)', 'aol\-iweng' : 'AOL-Iweng', 'webcapture' : 'Acrobat Webcapture', 'winamp' : 'WinAmp (media player)', 'chrome' : 'Google Chrome', 'analogx_proxy' : 'AnalogX Proxy', 'sylera' : 'Sylera', 'rss\sxpress' : 'RSS Xpress (RSS Reader)', 'xchaos_arachne' : 'Arachne', 'mspie' : 'MS Pocket Internet Explorer (PDA/Phone browser)', 'lynx' : 'Lynx', 'alcatel' : 'Alcatel Browser (PDA/Phone browser)', 'emailsiphon' : 'EmailSiphon', 'POE\-Component\-Client\-HTTP' : 'HTTP user-agent for POE (portable networking framework for Perl)', 'javaws' : 'Java Web Start', 'ecatch' : 'eCatch', 'aggrevator' : 'Aggrevator (RSS Reader)', 'mmef' : 'Microsoft Mobile Explorer (PDA/Phone browser)', 'qts' : 'QuickTime (media player)', 'linemodebrowser' : 'W3C Line Mode Browser', 'wizz\srss\snews\sreader' : 'Wizz RSS News Reader (RSS Reader)', 'xine' : 'Xine, a free multimedia player (media player)', 'gnome\-vfs' : 'Gnome FileSystem Abstraction library', 'flock' : 'Flock', 'audion' : 'Audion (media player)', 'icecat' : 'GNU IceCat', 'webfetcher' : 'WebFetcher', 'flashget' : 'FlashGet', 'docomo' : 'I-Mode phone (PDA/Phone browser)', 'friendlyspider' : 'FriendlySpider', 'wapalizer' : 'WAPalizer (PDA/Phone browser)', 'ipcheck' : 'Supervision IP Check (phone)', 'wapsilon' : 'WAPsilon (PDA/Phone browser)', 'svn' : 'Subversion client', 'lwp' : 'LibWWW-perl', 'plagger' : 'Plagger (RSS Reader)', 'shrook' : 'Shrook (RSS Reader)', 'mplayer' : 'The Movie Player (media player)', 'nsplayer' : 'NetShow Player (media player)', 'mint_audio' : 'Mint Audio (media player)', 'fget' : 'FGet', 'panasonic' : 'Panasonic Browser (PDA/Phone browser)', 'rssreader' : 'RssReader (RSS Reader)', 'download\smaster' : 'Download Master', 'itunes' : 'Apple iTunes (media player)', 'arora' : 'Arora', 'contiki' : 'Contiki', 'mot\-' : 'Motorola Browser (PDA/Phone browser)', 'nutscrape' : 'Nutscrape', 'fdm' : 'FDM Free Download Manager', 'prism' : 'Prism', 'safari' : 'Safari', 'encompass' : 'Encompass', 'feedreader' : 'FeedReader (RSS Reader)', 'newsgator' : 'NewsGator (RSS Reader)', 'microsoft\-webdav\-miniredir' : 'Microsoft Data Access Component Internet Publishing Provider', 'android' : 'Android browser (PDA/Phone browser)', 'strata' : 'Strata', 'teleport' : 'TelePort Pro', 'songbird' : 'Songbird', 'syndirella' : 'Syndirella (RSS Reader)', 'epiphany' : 'Epiphany', 'minefield' : 'Minefield (Firefox 3.0 development)', 'ncsa_mosaic' : 'NCSA Mosaic', 'links' : 'Links', 'macweb' : 'MacWeb', 'iphone' : 'IPhone (PDA/Phone browser)', 'cjb\.net' : 'CJB.NET Proxy', 'bpftp' : 'BPFTP', 'netcaptor' : 'NetCaptor', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sdav' : 'Microsoft Data Access Component Internet Publishing Provider DAV', 'dreamcast' : 'Dreamcast', 'straw' : 'Straw (RSS Reader)', 'windows\-media\-player' : 'Windows Media Player (media player)', 'philips' : 'Philips Browser (PDA/Phone browser)', 'netpositive' : 'NetPositive', 'doris' : 'Doris (for Symbian)', 'gstreamer' : 'GStreamer (media library)', 'intergo' : 'InterGO', 'shiira' : 'Shiira', 'gregarius' : 'Gregarius (RSS Reader)', 'potu' : 'Potu (RSS Reader)', 'blackberry' : 'BlackBerry (PDA/Phone browser)', 'smallproxy' : 'SmallProxy', 'galeon' : 'Galeon', 'iceweasel' : 'Iceweasel', 'leechget' : 'LeechGet', 'opera' : 'Opera', 'pubsub\-rss\-reader' : 'PubSub (RSS Reader)', 'vodafone' : 'Vodaphone browser (PDA/Phone browser)', 'rssbandit' : 'RSS Bandit (RSS Reader)', 'samsung' : 'Samsung (PDA/Phone browser)', 'charon' : 'Charon', 'democracy' : 'Democracy', 'freshdownload' : 'FreshDownload', 'freeamp' : 'FreeAmp (media player)', 'nokia' : 'Nokia Browser (PDA/Phone browser)', 'elinks' : 'ELinks', 'multizilla' : 'MultiZilla', 'ericsson' : 'Ericsson Browser (PDA/Phone browser)', 'nikto' : 'Nikto Web Scanner', 'mpg123' : 'mpg123 (media player)', 'gnus' : 'Gnus Network User Services', 'firefox' : 'Firefox', 'msie' : 'MS Internet Explorer', 'betanews_reader' : 'Betanews Reader (RSS Reader)', 'akregator' : 'Akregator (RSS Reader)', 'hatena_rss' : 'Hatena (RSS Reader)', 'iceape' : 'GNU IceApe', 'viking' : 'Viking', 'k\-ninja' : 'K-Ninja', 'ibrowse' : 'iBrowse', 'sonyericsson' : 'Sony/Ericsson Browser (PDA/Phone browser)', 'portalmmm' : 'I-Mode phone (PDA/Phone browser)', 'apt' : 'Debian APT', 'curl' : 'Curl', 'xbox' : 'XBoX', 'aweb' : 'AWeb', 'WebSec' : 'Web Secretary', 'applesyndication' : 'AppleSyndication (RSS Reader)', 'qnx\svoyager' : 'QNX Voyager', 'netnewswire' : 'NetNewsWire (RSS Reader)', 'cnf2' : 'Supervision I-Mode ByTel (phone)', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\scache\smanager' : 'Microsoft Data Access Component Internet Publishing Provider Cache Manager', 'go!zilla' : 'Go!Zilla', 'cyndicate' : 'Cyndicate (RSS Reader)', 'wget' : 'Wget', 'jetaudio' : 'JetAudio (media player)', 'sharpreader' : 'SharpReader (RSS Reader)', 'w3c_validator' : 'W3C Validator', 'netscape' : 'Netscape', 'webcollage' : 'WebCollage (PDA/Phone browser)', 'feeddemon' : 'FeedDemon (RSS Reader)', 'wap' : 'Unknown WAP browser (PDA/Phone browser)', 'aiderss' : 'AideRSS (RSS Reader)', 'lg\-' : 'LG (PDA/Phone browser)', 'webzip' : 'WebZIP', 'pulpfiction' : 'PulpFiction (RSS Reader)', 'webreaper' : 'WebReaper', 'k\-meleon' : 'K-Meleon', 'pluck' : 'Pluck (RSS Reader)', 'msfrontpageexpress' : 'MS FrontPage Express', 'fresco' : 'ANT Fresco', 'httrack' : 'HTTrack', 'real' : 'Real player or compatible (media player)', 'quicktime' : 'QuickTime (media player)', 'konqueror' : 'Konqueror', 'jigsaw' : 'W3C Validator', 'sie\-' : 'SIE (PDA/Phone browser)', 'mozilla' : 'Mozilla', '22acidownload' : '22AciDownload', 'netants' : 'NetAnts', 'csscheck' : 'WDG CSS Validator', 'newzcrawler' : 'NewzCrawler (RSS Reader)', 'sagem' : 'Sagem (PDA/Phone browser)', 'xmms' : 'XMMS (media player)', 'rssxpress' : 'RSSXpress (RSS Reader)', 'wdg_validator' : 'WDG HTML Validator', 'amigavoyager' : 'AmigaVoyager', 'vienna' : 'Vienna (RSS Reader)', 'feedtools' : 'FeedTools (RSS Reader)', 'camino' : 'Camino', 'blogbridge' : 'BlogBridge (RSS Reader)', 'bonecho' : 'BonEcho (Firefox 2.0 development)', 'granparadiso' : 'GranParadiso (Firefox 3.0 development)', 'hotjava' : 'Sun HotJava', 'up\.' : 'UP.Browser (PDA/Phone browser)', 'w3m' : 'w3m', 'dillo' : 'Dillo', 'liferea' : 'Liferea (RSS Reader)', 'getright' : 'GetRight', 'kazehakase' : 'Kazehakase', 'lotus\-notes' : 'Lotus Notes web client', 'tzgeturl' : 'TzGetURL', 'sage' : 'Sage (RSS Reader)', 'webcopier' : 'WebCopier', 'phoenix' : 'Phoenix', 'abrowse' : 'ABrowse', 'xaudio' : 'Some XAudio Engine based MPEG player (media player)', 'sec\-' : 'Sony/Ericsson (PDA/Phone browser)', 'w3clinemode' : 'W3CLineMode', 'chimera' : 'Chimera (Old Camino)', 'headdump' : 'HeadDump', 'abilon' : 'Abilon (RSS Reader)', 'downloadagent' : 'DownloadAgent', 'cyberdog' : 'Cyberdog', 'rssowl' : 'RSSOwl (RSS Reader)', 'newsfire' : 'NewsFire (RSS Reader)', 'webdownloader\sfor\sx' : 'Downloader for X', 'sonique' : 'Sonique (media player)', 'webmirror' : 'WebMirror', 'webexplorer' : 'IBM-WebExplorer', 'chilkat' : 'Chilkat', 'ossproxy' : 'OSSProxy', 'libwww' : 'LibWWW', 'adobeair' : 'AdobeAir', 'uplayer' : 'Ultra Player (media player)', 'amaya' : 'Amaya', 'webtv' : 'WebTV browser', 'neon' : 'Neon HTTP and WebDAV client library', 'greatnews' : 'GreatNews (RSS Reader)', 'seamonkey' : 'SeaMonkey', 'omniweb' : 'OmniWeb', 'donzilla' : 'Donzilla', 'webvcr' : 'WebVCR', 'icab' : 'iCab', 'firebird' : 'Firebird (Old Firefox)', 'staroffice' : 'StarOffice', 'emacs\-w3' : 'Emacs/w3s'} +browsers_hashid = {'nsplayer' : 'NetShow Player (media player)', 'xaudio' : 'Some XAudio Engine based MPEG player (media player)', 'donzilla' : 'Donzilla', 'gnome\-vfs' : 'Gnome FileSystem Abstraction library', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\scache\smanager' : 'Microsoft Data Access Component Internet Publishing Provider Cache Manager', 'rssxpress' : 'RSSXpress (RSS Reader)', 'flock' : 'Flock', 'microsoft\-webdav\-miniredir' : 'Microsoft Data Access Component Internet Publishing Provider', 'contiki' : 'Contiki', 'galeon' : 'Galeon', 'mspie' : 'MS Pocket Internet Explorer (PDA/Phone browser)', 'aiderss' : 'AideRSS (RSS Reader)', 'jigsaw' : 'W3C Validator', 'webexplorer' : 'IBM-WebExplorer', 'blogbridge' : 'BlogBridge (RSS Reader)', 'windows\-media\-player' : 'Windows Media Player (media player)', 'chrome' : 'Google Chrome', 'webtv' : 'WebTV browser', 'iceape' : 'GNU IceApe', 'httrack' : 'HTTrack', 'mint_audio' : 'Mint Audio (media player)', 'flashget' : 'FlashGet', 'ecatch' : 'eCatch', 'newsgator' : 'NewsGator (RSS Reader)', 'analogx_proxy' : 'AnalogX Proxy', 'freeamp' : 'FreeAmp (media player)', 'nokia' : 'Nokia Browser (PDA/Phone browser)', 'macweb' : 'MacWeb', 'alcatel' : 'Alcatel Browser (PDA/Phone browser)', 'icecat' : 'GNU IceCat', 'arora' : 'Arora', 'webcapture' : 'Acrobat Webcapture', 'go!zilla' : 'Go!Zilla', 'liferea' : 'Liferea (RSS Reader)', 'philips' : 'Philips Browser (PDA/Phone browser)', 'pluck' : 'Pluck (RSS Reader)', 'ibrowse' : 'iBrowse', 'xbox' : 'XBoX', 'webcollage' : 'WebCollage (PDA/Phone browser)', 'w3c_validator' : 'W3C Validator', 'real' : 'Real player or compatible (media player)', 'cnf2' : 'Supervision I-Mode ByTel (phone)', 'msie' : 'MS Internet Explorer', 'samsung' : 'Samsung (PDA/Phone browser)', 'links' : 'Links', 'docomo' : 'I-Mode phone (PDA/Phone browser)', 'democracy' : 'Democracy', 'freshdownload' : 'FreshDownload', 'webfetcher' : 'WebFetcher', 'qnx\svoyager' : 'QNX Voyager', 'netscape' : 'Netscape', 'encompass' : 'Encompass', 'sonique' : 'Sonique (media player)', 'cjb\.net' : 'CJB.NET Proxy', 'vienna' : 'Vienna (RSS Reader)', 'firebird' : 'Firebird (Old Firefox)', 'potu' : 'Potu (RSS Reader)', 'javaws' : 'Java Web Start', 'w3m' : 'w3m', 'mmef' : 'Microsoft Mobile Explorer (PDA/Phone browser)', 'ncsa_mosaic' : 'NCSA Mosaic', 'lotus\-notes' : 'Lotus Notes web client', 'iceweasel' : 'Iceweasel', 'amaya' : 'Amaya', 'feedtools' : 'FeedTools (RSS Reader)', 'granparadiso' : 'GranParadiso (Firefox 3.0 development)', 'feeddemon' : 'FeedDemon (RSS Reader)', 'netants' : 'NetAnts', 'xine' : 'Xine, a free multimedia player (media player)', 'gregarius' : 'Gregarius (RSS Reader)', 'hatena_rss' : 'Hatena (RSS Reader)', 'rss\sxpress' : 'RSS Xpress (RSS Reader)', 'straw' : 'Straw (RSS Reader)', 'webreaper' : 'WebReaper', 'sec\-' : 'Sony/Ericsson (PDA/Phone browser)', 'wget' : 'Wget', 'grabber' : 'Grabber', 'gstreamer' : 'GStreamer (media library)', 'aggrevator' : 'Aggrevator (RSS Reader)', 'iphone' : 'IPhone (PDA/Phone browser)', 'aweb' : 'AWeb', 'firefox' : 'Firefox', 'staroffice' : 'StarOffice', 'ossproxy' : 'OSSProxy', 'lg\-' : 'LG (PDA/Phone browser)', 'adobeair' : 'AdobeAir', 'w3clinemode' : 'W3CLineMode', 'gnus' : 'Gnus Network User Services', 'mozilla' : 'Mozilla', 'wizz\srss\snews\sreader' : 'Wizz RSS News Reader (RSS Reader)', 'download\smaster' : 'Download Master', 'vodafone' : 'Vodaphone browser (PDA/Phone browser)', 'dreamcast' : 'Dreamcast', 'getright' : 'GetRight', 'svn' : 'Subversion client', 'camino' : 'Camino', 'msfrontpageexpress' : 'MS FrontPage Express', 'intergo' : 'InterGO', 'rssbandit' : 'RSS Bandit (RSS Reader)', 'portalmmm' : 'I-Mode phone (PDA/Phone browser)', 'WebSec' : 'Web Secretary', 'mplayer' : 'The Movie Player (media player)', 'mpg123' : 'mpg123 (media player)', 'shiira' : 'Shiira', 'quicktime' : 'QuickTime (media player)', 'smallproxy' : 'SmallProxy', 'bpftp' : 'BPFTP', 'webvcr' : 'WebVCR', 'webzip' : 'WebZIP', 'csscheck' : 'WDG CSS Validator', 'netcaptor' : 'NetCaptor', 'doris' : 'Doris (for Symbian)', 'uplayer' : 'Ultra Player (media player)', 'ericsson' : 'Ericsson Browser (PDA/Phone browser)', 'pubsub\-rss\-reader' : 'PubSub (RSS Reader)', 'headdump' : 'HeadDump', 'abilon' : 'Abilon (RSS Reader)', 'opera' : 'Opera', 'neon' : 'Neon HTTP and WebDAV client library', 'sonyericsson' : 'Sony/Ericsson Browser (PDA/Phone browser)', 'sylera' : 'Sylera', 'sie\-' : 'SIE (PDA/Phone browser)', 'webmirror' : 'WebMirror', 'ipcheck' : 'Supervision IP Check (phone)', 'netnewswire' : 'NetNewsWire (RSS Reader)', 'wdg_validator' : 'WDG HTML Validator', 'friendlyspider' : 'FriendlySpider', 'up\.' : 'UP.Browser (PDA/Phone browser)', 'wapalizer' : 'WAPalizer (PDA/Phone browser)', 'amigavoyager' : 'AmigaVoyager', 'safari' : 'Safari', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sdav' : 'Microsoft Data Access Component Internet Publishing Provider DAV', 'POE\-Component\-Client\-HTTP' : 'HTTP user-agent for POE (portable networking framework for Perl)', 'chimera' : 'Chimera (Old Camino)', 'curl' : 'Curl', 'konqueror' : 'Konqueror', 'audion' : 'Audion (media player)', 'nikto' : 'Nikto Web Scanner', 'tzgeturl' : 'TzGetURL', 'blackberry' : 'BlackBerry (PDA/Phone browser)', 'dillo' : 'Dillo', 'qts' : 'QuickTime (media player)', 'emacs\-w3' : 'Emacs/w3s', 'wap' : 'Unknown WAP browser (PDA/Phone browser)', 'bonecho' : 'BonEcho (Firefox 2.0 development)', 'lynx' : 'Lynx', 'cyndicate' : 'Cyndicate (RSS Reader)', 'itunes' : 'Apple iTunes (media player)', 'winamp' : 'WinAmp (media player)', 'phoenix' : 'Phoenix', 'applesyndication' : 'AppleSyndication (RSS Reader)', 'kazehakase' : 'Kazehakase', 'multizilla' : 'MultiZilla', 'hotjava' : 'Sun HotJava', 'greatnews' : 'GreatNews (RSS Reader)', 'betanews_reader' : 'Betanews Reader (RSS Reader)', 'linemodebrowser' : 'W3C Line Mode Browser', 'lwp' : 'LibWWW-perl', 'seamonkey' : 'SeaMonkey', 'jetaudio' : 'JetAudio (media player)', 'sagem' : 'Sagem (PDA/Phone browser)', 'omniweb' : 'OmniWeb', 'emailsiphon' : 'EmailSiphon', 'newsfire' : 'NewsFire (RSS Reader)', 'chilkat' : 'Chilkat', 'aol\-iweng' : 'AOL-Iweng', 'rssreader' : 'RssReader (RSS Reader)', 'minefield' : 'Minefield (Firefox 3.0 development)', '22acidownload' : '22AciDownload', 'downloadagent' : 'DownloadAgent', 'android' : 'Android browser (PDA/Phone browser)', 'plagger' : 'Plagger (RSS Reader)', 'mot\-' : 'Motorola Browser (PDA/Phone browser)', 'fdm' : 'FDM Free Download Manager', 'panasonic' : 'Panasonic Browser (PDA/Phone browser)', 'cyberdog' : 'Cyberdog', 'webcopier' : 'WebCopier', 'abrowse' : 'ABrowse', 'strata' : 'Strata', 'leechget' : 'LeechGet', 'prism' : 'Prism', 'charon' : 'Charon', 'cloudflare' : 'CloudFlare', 'teleport' : 'TelePort Pro', 'wapsilon' : 'WAPsilon (PDA/Phone browser)', 'sage' : 'Sage (RSS Reader)', 'xchaos_arachne' : 'Arachne', 'elinks' : 'ELinks', 'epiphany' : 'Epiphany', 'jetbrains_omea' : 'Omea (RSS Reader)', 'nutscrape' : 'Nutscrape', 'icab' : 'iCab', 'webdownloader\sfor\sx' : 'Downloader for X', 'sharpreader' : 'SharpReader (RSS Reader)', 'xmms' : 'XMMS (media player)', 'k\-ninja' : 'K-Ninja', 'apt' : 'Debian APT', 'rssowl' : 'RSSOwl (RSS Reader)', 'newzcrawler' : 'NewzCrawler (RSS Reader)', 'shrook' : 'Shrook (RSS Reader)', 'k\-meleon' : 'K-Meleon', 'fget' : 'FGet', 'libwww' : 'LibWWW', 'songbird' : 'Songbird', 'pulpfiction' : 'PulpFiction (RSS Reader)', 'netpositive' : 'NetPositive', 'akregator' : 'Akregator (RSS Reader)', 'feedreader' : 'FeedReader (RSS Reader)', 'fresco' : 'ANT Fresco', 'syndirella' : 'Syndirella (RSS Reader)', 'viking' : 'Viking'} -browsers_icons = {'jetbrains_omea' : 'rss', 'webcapture' : 'adobe', 'winamp' : 'mediaplayer', 'chrome' : 'chrome', 'analogx_proxy' : 'analogx', 'sylera' : 'mozilla', 'rss\sxpress' : 'rss', 'mspie' : 'pdaphone', 'lynx' : 'lynx', 'alcatel' : 'pdaphone', 'javaws' : 'java', 'ecatch' : 'ecatch', 'aggrevator' : 'rss', 'mmef' : 'pdaphone', 'qts' : 'mediaplayer', 'wizz\srss\snews\sreader' : 'wizz', 'xine' : 'mediaplayer', 'gnome\-vfs' : 'gnome', 'flock' : 'flock', 'audion' : 'mediaplayer', 'icecat' : 'icecat', 'flashget' : 'flashget', 'docomo' : 'pdaphone', 'avantbrowser' : 'avant', 'wapalizer' : 'pdaphone', 'wapsilon' : 'pdaphone', 'svn' : 'subversion', 'plagger' : 'rss', 'shrook' : 'rss', 'mplayer' : 'mediaplayer', 'nsplayer' : 'netshow', 'mint_audio' : 'mediaplayer', 'panasonic' : 'pdaphone', 'rssreader' : 'rss', 'itunes' : 'mediaplayer', 'microsoft\soffice\sprotocol\sdiscovery' : 'frontpage', 'mot\-' : 'pdaphone', 'prism' : 'mozilla', 'safari' : 'safari', 'encompass' : 'encompass', 'feedreader' : 'rss', 'newsgator' : 'rss', 'microsoft\-webdav\-miniredir' : 'frontpage', 'android' : 'android', 'teleport' : 'teleport', 'strata' : 'mozilla', 'songbird' : 'mozilla', 'syndirella' : 'rss', 'epiphany' : 'epiphany', 'minefield' : 'firefox', 'ncsa_mosaic' : 'ncsa_mosaic', 'macweb' : 'macweb', 'iphone' : 'pdaphone', 'cjb\.net' : 'cjbnet', 'bpftp' : 'bpftp', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sdav' : 'frontpage', 'dreamcast' : 'dreamcast', 'straw' : 'rss', 'windows\-media\-player' : 'mplayer', 'philips' : 'pdaphone', 'netpositive' : 'netpositive', 'doris' : 'doris', 'gregarius' : 'rss', 'potu' : 'rss', 'blackberry' : 'pdaphone', 'galeon' : 'galeon', 'iceweasel' : 'iceweasel', 'leechget' : 'leechget', 'opera' : 'opera', 'pubsub\-rss\-reader' : 'rss', 'vodafone' : 'pdaphone', 'rssbandit' : 'rss', 'samsung' : 'pdaphone', 'freshdownload' : 'freshdownload', 'freeamp' : 'mediaplayer', 'nokia' : 'pdaphone', 'multizilla' : 'multizilla', 'ericsson' : 'pdaphone', 'mpg123' : 'mediaplayer', 'gnus' : 'gnus', 'firefox' : 'firefox', 'msie' : 'msie', 'betanews_reader' : 'rss', 'akregator' : 'rss', 'hatena_rss' : 'rss', 'iceape' : 'mozilla', 'ibrowse' : 'ibrowse', 'sonyericsson' : 'pdaphone', 'portalmmm' : 'pdaphone', 'apt' : 'apt', 'xbox' : 'winxbox', 'aweb' : 'aweb', 'applesyndication' : 'rss', 'netnewswire' : 'rss', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\scache\smanager' : 'frontpage', 'go!zilla' : 'gozilla', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sprotocol\sdiscovery' : 'frontpage', 'jetaudio' : 'mediaplayer', 'sharpreader' : 'rss', 'netscape' : 'netscape', 'webcollage' : 'pdaphone', 'feeddemon' : 'rss', 'wap' : 'pdaphone', 'aiderss' : 'rss', 'lg\-' : 'pdaphone', 'webzip' : 'webzip', 'pulpfiction' : 'rss', 'webreaper' : 'webreaper', 'pluck' : 'rss', 'k\-meleon' : 'kmeleon', 'msfrontpageexpress' : 'fpexpress', 'fresco' : 'fresco', 'httrack' : 'httrack', 'real' : 'real', 'konqueror' : 'konqueror', 'sie\-' : 'pdaphone', 'mozilla' : 'mozilla', 'sagem' : 'pdaphone', 'newzcrawler' : 'rss', 'rssxpress' : 'rss', 'xmms' : 'mediaplayer', 'vienna' : 'rss', 'amigavoyager' : 'amigavoyager', 'feedtools' : 'rss', 'camino' : 'chimera', 'blogbridge' : 'rss', 'bonecho' : 'firefox', 'granparadiso' : 'firefox', 'hotjava' : 'hotjava', 'up\.' : 'pdaphone', 'dillo' : 'dillo', 'liferea' : 'rss', 'getright' : 'getright', 'kazehakase' : 'mozilla', 'lotus\-notes' : 'lotusnotes', 'sage' : 'rss', 'webcopier' : 'webcopier', 'phoenix' : 'phoenix', 'sec\-' : 'pdaphone', 'xaudio' : 'mediaplayer', 'microsoft\soffice\sexistence\sdiscovery' : 'frontpage', 'chimera' : 'chimera', 'abilon' : 'abilon', 'rssowl' : 'rss', 'cyberdog' : 'cyberdog', 'newsfire' : 'rss', 'sonique' : 'mediaplayer', 'adobeair' : 'adobe', 'uplayer' : 'mediaplayer', 'amaya' : 'amaya', 'webtv' : 'webtv', 'neon' : 'neon', 'greatnews' : 'rss', 'seamonkey' : 'seamonkey', 'omniweb' : 'omniweb', 'donzilla' : 'mozilla', 'icab' : 'icab', 'firebird' : 'phoenix', 'staroffice' : 'staroffice'} +browsers_icons = {'gregarius' : 'rss', 'hatena_rss' : 'rss', 'feeddemon' : 'rss', 'feedtools' : 'rss', 'granparadiso' : 'firefox', 'xine' : 'mediaplayer', 'mmef' : 'pdaphone', 'ncsa_mosaic' : 'ncsa_mosaic', 'iceweasel' : 'iceweasel', 'amaya' : 'amaya', 'lotus\-notes' : 'lotusnotes', 'javaws' : 'java', 'aggrevator' : 'rss', 'aweb' : 'aweb', 'iphone' : 'pdaphone', 'grabber' : 'grabber', 'rss\sxpress' : 'rss', 'webreaper' : 'webreaper', 'straw' : 'rss', 'sec\-' : 'pdaphone', 'getright' : 'getright', 'svn' : 'subversion', 'camino' : 'chimera', 'wizz\srss\snews\sreader' : 'wizz', 'vodafone' : 'pdaphone', 'dreamcast' : 'dreamcast', 'adobeair' : 'adobe', 'mozilla' : 'mozilla', 'gnus' : 'gnus', 'firefox' : 'firefox', 'microsoft\soffice\sprotocol\sdiscovery' : 'frontpage', 'lg\-' : 'pdaphone', 'staroffice' : 'staroffice', 'bpftp' : 'bpftp', 'webzip' : 'webzip', 'doris' : 'doris', 'uplayer' : 'mediaplayer', 'mplayer' : 'mediaplayer', 'mpg123' : 'mediaplayer', 'rssbandit' : 'rss', 'msfrontpageexpress' : 'fpexpress', 'portalmmm' : 'pdaphone', 'mspie' : 'pdaphone', 'galeon' : 'galeon', 'aiderss' : 'rss', 'microsoft\-webdav\-miniredir' : 'frontpage', 'flock' : 'flock', 'nsplayer' : 'netshow', 'donzilla' : 'mozilla', 'gnome\-vfs' : 'gnome', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\scache\smanager' : 'frontpage', 'rssxpress' : 'rss', 'xaudio' : 'mediaplayer', 'analogx_proxy' : 'analogx', 'alcatel' : 'pdaphone', 'freeamp' : 'mediaplayer', 'macweb' : 'macweb', 'nokia' : 'pdaphone', 'newsgator' : 'rss', 'ecatch' : 'ecatch', 'httrack' : 'httrack', 'iceape' : 'mozilla', 'flashget' : 'flashget', 'mint_audio' : 'mediaplayer', 'chrome' : 'chrome', 'blogbridge' : 'rss', 'windows\-media\-player' : 'mplayer', 'webtv' : 'webtv', 'samsung' : 'pdaphone', 'msie' : 'msie', 'pluck' : 'rss', 'philips' : 'pdaphone', 'liferea' : 'rss', 'xbox' : 'winxbox', 'webcollage' : 'pdaphone', 'real' : 'real', 'ibrowse' : 'ibrowse', 'webcapture' : 'adobe', 'icecat' : 'icecat', 'go!zilla' : 'gozilla', 'firebird' : 'phoenix', 'potu' : 'rss', 'encompass' : 'encompass', 'netscape' : 'netscape', 'cjb\.net' : 'cjbnet', 'vienna' : 'rss', 'sonique' : 'mediaplayer', 'docomo' : 'pdaphone', 'freshdownload' : 'freshdownload', 'strata' : 'mozilla', 'panasonic' : 'pdaphone', 'cyberdog' : 'cyberdog', 'webcopier' : 'webcopier', 'plagger' : 'rss', 'mot\-' : 'pdaphone', 'android' : 'android', 'newsfire' : 'rss', 'minefield' : 'firefox', 'rssreader' : 'rss', 'icab' : 'icab', 'jetbrains_omea' : 'rss', 'epiphany' : 'epiphany', 'wapsilon' : 'pdaphone', 'sage' : 'rss', 'leechget' : 'leechget', 'teleport' : 'teleport', 'prism' : 'mozilla', 'k\-meleon' : 'kmeleon', 'apt' : 'apt', 'rssowl' : 'rss', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sprotocol\sdiscovery' : 'frontpage', 'shrook' : 'rss', 'newzcrawler' : 'rss', 'sharpreader' : 'rss', 'xmms' : 'mediaplayer', 'fresco' : 'fresco', 'syndirella' : 'rss', 'netpositive' : 'netpositive', 'akregator' : 'rss', 'feedreader' : 'rss', 'songbird' : 'mozilla', 'pulpfiction' : 'rss', 'sie\-' : 'pdaphone', 'netnewswire' : 'rss', 'sylera' : 'mozilla', 'microsoft\soffice\sexistence\sdiscovery' : 'frontpage', 'neon' : 'neon', 'opera' : 'opera', 'sonyericsson' : 'pdaphone', 'ericsson' : 'pdaphone', 'pubsub\-rss\-reader' : 'rss', 'abilon' : 'abilon', 'chimera' : 'chimera', 'konqueror' : 'konqueror', 'amigavoyager' : 'amigavoyager', 'safari' : 'safari', 'microsoft\sdata\saccess\sinternet\spublishing\sprovider\sdav' : 'frontpage', 'wapalizer' : 'pdaphone', 'up\.' : 'pdaphone', 'itunes' : 'mediaplayer', 'winamp' : 'mediaplayer', 'applesyndication' : 'rss', 'phoenix' : 'phoenix', 'wap' : 'pdaphone', 'bonecho' : 'firefox', 'lynx' : 'lynx', 'dillo' : 'dillo', 'qts' : 'mediaplayer', 'blackberry' : 'pdaphone', 'audion' : 'mediaplayer', 'omniweb' : 'omniweb', 'seamonkey' : 'seamonkey', 'jetaudio' : 'mediaplayer', 'sagem' : 'pdaphone', 'avantbrowser' : 'avant', 'greatnews' : 'rss', 'hotjava' : 'hotjava', 'betanews_reader' : 'rss', 'kazehakase' : 'mozilla', 'multizilla' : 'multizilla'} diff --git a/iwla.py b/iwla.py index fd5b2ab..5e00640 100755 --- a/iwla.py +++ b/iwla.py @@ -683,13 +683,40 @@ class IWLA(object): return True - def start(self, _file): + def _reset(self): + reset_time = time.strptime(self.args.reset, '%m/%Y') + + self.logger.info('Reset time') + self.logger.info(reset_time) + + self.meta_infos['last_time'] = reset_time + + cur_time = time.localtime() + year = reset_time.tm_year + while year < cur_time.tm_year: + db_path = os.path.join(conf.DB_ROOT, str(year)) + if os.path.exists(db_path): shutil.rmtree(db_path) + output_path = os.path.join(conf.DISPLAY_ROOT, str(year)) + if os.path.exists(output_path): shutil.rmtree(output_path) + year += 1 + month = reset_time.tm_mon + while month <= cur_time.tm_mon: + db_path = os.path.join(conf.DB_ROOT, str(year), '%02d' % (month)) + if os.path.exists(db_path): shutil.rmtree(db_path) + output_path = os.path.join(conf.DISPLAY_ROOT, str(year), '%02d' % (month)) + if os.path.exists(output_path): shutil.rmtree(output_path) + month += 1 + + def start(self, _file, args): + self.args = args self.start_time = datetime.now() self.logger.info('==> Load previous database') self.meta_infos = self._deserialize(conf.META_PATH) or self._clearMeta() if self.meta_infos['last_time']: + if args.reset: + self._reset() self.logger.info('Last time') self.logger.info(self.meta_infos['last_time']) self.current_analysis = self._deserialize(self.getDBFilename(self.meta_infos['last_time'])) or self._clearVisits() @@ -743,7 +770,11 @@ class FileIter(object): self.cur_file = None if not self.filenames: raise StopIteration() - self.cur_file = open(self.filenames.pop(0)) + filename = self.filenames.pop(0) + if filename.endswith('gz'): + self.cur_file = gzip.open(filename, 'r') + else: + self.cur_file = open(filename) def next(self): l = self.cur_file.readline() @@ -770,6 +801,9 @@ if __name__ == '__main__': default='INFO', type=str, help='Loglevel in %s, default : %s' % (['DEBUG', 'INFO', 'WARNING', 'ERROR', 'CRITICAL'], 'INFO')) + parser.add_argument('-r', '--reset', dest='reset', + help='Reset analysis to a specific date (month/year)') + args = parser.parse_args() # Load user conf @@ -804,7 +838,7 @@ if __name__ == '__main__': sys.exit(0) if args.stdin: - iwla.start(sys.stdin) + iwla.start(sys.stdin, args) else: filename = args.file or conf.analyzed_filename - iwla.start(FileIter(filename)) + iwla.start(FileIter(filename), args) diff --git a/plugins/pre_analysis/page_to_hit.py b/plugins/pre_analysis/page_to_hit.py index 77772bb..282f53f 100644 --- a/plugins/pre_analysis/page_to_hit.py +++ b/plugins/pre_analysis/page_to_hit.py @@ -19,6 +19,7 @@ # import re +import logging from iwla import IWLA from iplugin import IPlugin @@ -64,6 +65,7 @@ class IWLAPreAnalysisPageToHit(IPlugin): self.hp_regexps = self.iwla.getConfValue('hit_to_page_conf', []) self.hp_regexps = map(lambda(r): re.compile(r), self.hp_regexps) + self.logger = logging.getLogger(self.__class__.__name__) return True def hook(self): @@ -85,7 +87,7 @@ class IWLAPreAnalysisPageToHit(IPlugin): # Page to hit for regexp in self.ph_regexps: if regexp.match(uri): - #print '%s is a hit' % (uri ) + self.logger.debug('%s changed from page to hit' % (uri)) request['is_page'] = False super_hit['viewed_pages'] -= 1 super_hit['viewed_hits'] += 1 @@ -94,7 +96,7 @@ class IWLAPreAnalysisPageToHit(IPlugin): # Hit to page for regexp in self.hp_regexps: if regexp.match(uri): - #print '%s is a page' % (uri ) + self.logger.debug('%s changed from hit to page' % (uri)) request['is_page'] = True super_hit['viewed_pages'] += 1 super_hit['viewed_hits'] -= 1 diff --git a/plugins/pre_analysis/robots.py b/plugins/pre_analysis/robots.py index 41c744e..d84087d 100644 --- a/plugins/pre_analysis/robots.py +++ b/plugins/pre_analysis/robots.py @@ -20,6 +20,7 @@ import re import logging +import inspect from iwla import IWLA from iplugin import IPlugin @@ -66,7 +67,11 @@ class IWLAPreAnalysisRobots(IPlugin): return True def _setRobot(self, k, super_hit): - self.logger.debug('%s is a robot' % (k)) + callerframerecord = inspect.stack()[1] + frame = callerframerecord[0] + info = inspect.getframeinfo(frame) + + self.logger.debug('%s is a robot (caller %s:%d)' % (k, info.function, info.lineno)) super_hit['robot'] = 1 # Basic rule to detect robots @@ -84,6 +89,7 @@ class IWLAPreAnalysisRobots(IPlugin): if self.robot_re.match(first_page['http_user_agent']) or\ self.crawl_re.match(first_page['http_user_agent']): + self.logger.debug(first_page['http_user_agent']) self._setRobot(k, super_hit) continue @@ -93,6 +99,7 @@ class IWLAPreAnalysisRobots(IPlugin): break if isRobot: + self.logger.debug(first_page['http_user_agent']) self._setRobot(k, super_hit) continue @@ -103,6 +110,7 @@ class IWLAPreAnalysisRobots(IPlugin): # 2) pages without hit --> robot if not super_hit['viewed_hits']: + self.logger.debug(super_hit) self._setRobot(k, super_hit) continue