【摘要】 简单介绍了通过xml和html两种获取alexa 数据的方法。 碧森尤信 方法一:获取xml数据文件
http://data.alexa.com/data/+wQ411en8000lA?cli=10&dat=snba&ver=7.0&cdt=alx_vw%3D20%26wid%3D12206%26act%3D00000000000%26ss%3D1680x16t%3D0%26ttl%3D35371%26vis%3D1%26rq%3D4&url=pipcn.com
GET以上地址即可。把pipcn.com换为需要的域名。调用后将返回一段xml如下:
<?xml version="1.0" encoding="UTF-8"?> <ALEXA VER="0.9" URL="pipcn.com/" HOME="0" AID="="> <RLS TITLE="Related Links" PREFIX="http://" more ="15"> <RL href="/blog/xdcad.net/" TYPE="link" src="/blog/Editorial" TITLE="xdcad.net/" CONF="001" ASIN="B00009ZSU1"/> <RL href="/blog/sinoaec.com/" TYPE="link" src="/blog/Editorial" TITLE="筑龙网 建筑技术 标准规范 标准图集 政策法规 免" CONF="001" ASIN="B00006GRNB"/> <RL HREF="realestate.gov.cn/" TYPE="link" src="/blog/Editorial" TITLE="realestate.gov.cn/" CONF="001" ASIN="B00006GE0P"/> <RL HREF="myspace.com/" TYPE="link" src="/blog/UserEdit" TITLE="Myspace" CONF="001" ASIN="B00006FOXJ"/> <RL HREF="mochr.com/" TYPE="link" src="/blog/Editorial" TITLE="mochr.com/" CONF="001" ASIN="B00013Y3D6"/> <RL HREF="hc360.com/" TYPE="link" src="/blog/Editorial" TITLE="hc360" CONF="001" ASIN="B0001HO1RA"/> <RL HREF="far2000.com/" TYPE="link" src="/blog/Editorial" TITLE="FAR2000" CONF="001" ASIN="B00006E397"/> <RL href="/blog/cin.gov.cn/" TYPE="link" src="/blog/Editorial" TITLE="cin.gov.cn/" CONF="001" ASIN="B00006DIYN"/> <RL href="/blog/chinacsw.com/" TYPE="link" src="/blog/Editorial" TITLE="chinacsw.com/" CONF="001" ASIN="B0000AIQ3F"/> <RL href="/blog/cein.gov.cn/" TYPE="link" src="/blog/Editorial" TITLE="cein.gov.cn/" CONF="001" ASIN="B00006DG0I"/> </RLS> <SD TITLE="Alexa Site Data" FLAGS="DMOZ"> <AMZN ASIN="B000COPSKQ" URL="pipcn.com/"/> <ADDR STREET="Unlisted" CITY="" STATE="" ZIP="" COUNTRY="Unlisted"/> <CREATED DATE="18-Jan-2005" DAY="18" MONTH="01" YEAR="2005"/> <PHONE NUMBER="+86.27.62412133"/> <OWNER NAME="MOUSSIN"/> <EMAIL ADDR="MOUSSIN@ZJ.COM"/> <LANG LEX="zh-CN" CODE="gb2312"/> <LINKSIN NUM="6"/> <SPEED TEXT="4219" PCT="19"/> <POPULARITY URL="pipcn.com/" TEXT="234135"/> <RANK DELTA="-84674"/> <REACH RANK="354264"/> </SD> <DMOZ> <SITE BASE="pipcn.com/" TITLE="碧森尤信" DESC="中国建筑业无所不在的智库和人脉网络.Supply Ubiquitous Knowledge and Social Relation Network Service for Construction Practitioners of China"> <CATS/> </SITE> </DMOZ> </ALEXA> 这样,就可以通过程序解析就可以得到任何一个域名的Alexa排名了。
方法二:直接获取html数据文件
通过获取html源码,用正则表达式解析即可,这种方法容易受到干扰,但能按需要获取更多数据。见相关文章: user1/master/archives/2006/769.shtml
方法三:使用Web Service
Alexa官方提供了数据查询的web service,获取XML格式文件,见以下网页:
http://www.alexa.com/site/devcorner/web_info_services
本站搜索: Alexa [在Google上搜索相关文章] [在百度上搜索相关文章]
【郑重声明】 本站所有文章除注有来源网址外均为互联网首发,按照 创造共用方式授权,允许相关网站转载,但必须标明作者名称并在明显位置作好原文网址链接(复制以上链接),且不能运用于任何商业目的。 —— 建筑知识引擎小组
|