简单介绍百度新闻开放协议XML文档制作方法

互联网 17-3-14
开放协议概述 使用此开放协议,将会为您的网站带去更多流量! 《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及 开放协议概述《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及时地告知百度搜索引擎。采用了《互联网新闻开放协议》,就相当于网站的新闻被搜索引擎订阅,通过百度——全球最大的中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到您网站的新闻,进而为您的网站带来潜在的流量。开放协议非常简单! 您可以在我们的帮助下轻松使用。 开放协议内容下图为遵照《互联网新闻开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的新闻的相关信息。XML网页示例:XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。 *<document>——标记整个XML文件内容的开始和结束。*——站点地址。*——负责人员的Email。当有必要时,我们通过这个地址与您联系。*datePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的新闻更及时地出现在百度新闻中。*——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息,不包括新闻专题。*——新闻标题。*——新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个URL,相当于多篇新闻。<description>——新闻内容简介。*<text>——完整的新闻正文(仅包含正文文字,不包含HTML语言等其它字符)。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。*<image>——新闻正文内相关图片,采用绝对地址。若该篇新闻无相关图片,可以为空;若含有多张图片,请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。<<a href="http://www.php.cn/html/html-HEAD-2.html" target="_blank">head</a>lineImg>——为有可能成为头条的新闻制作的头条图,采用绝对地址。<<a href="http://www.php.cn/wiki/1051.html" target="_blank">key</a>words>——反映新闻主题内容的一个或多个关键词,关键词之间以空格隔开。此项仅作为参考,检索结果不完全依赖于此标签中的内容。<category>——新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。<author>——新闻作者,可以为机构或个人 。<source>——新闻来源,即原创媒体或其它机构 。*<pubdate>——新闻发布时间,与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。推荐时间格式:年月日小时分钟秒如:2005-11-09 10:37|2005/11/09 10:37:00|2005.11.09 10:37:00|2005年11月09日10时37分00秒|Fri, 09 Nov 2005 10:37:00 GMT开放协议使用<strong>使用之前</strong>,<strong>您需要了解以下几点:</strong> 无论您的网站已经成为百度新闻源,还是尚未被百度新闻搜索收录,都可以使用此开放协议。 您使用开放协议提供的内容应全部符合下面《新闻源收录标准》。 《互联网新闻开放协议》只是原始新闻源收录方式的一种协助和有益补充,而不是完全取代。 百度希望新闻源多样化,鼓励原创新闻内容。如果是具有大量有价值的新闻内容并能及时更新的正规、合法媒体网站,且网站服务器稳定、高速,就符合了百度收录新闻源的基本原则。百度新闻搜索收录的内容包括时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论,数码产品、房产、汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等,是由专业人士撰写或编辑的中文信息,不包括发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。您应对提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。请您在创建XML文件前务必阅读百度新闻搜索的新闻源收录标准,并<strong>特别注意</strong>: 1、百度新闻搜索收录的新闻源网站必须符合及严格遵守国家《互联网新闻信息服务管理规定》,并在新闻发布和转载过程中尊重创作人和源网站的著作权。 2、百度新闻搜索不适合收录的网站类型包括:论坛、博客、公司网站等。 3、百度新闻搜索不收录个人信息、广告、招标、教程、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。 4、百度新闻搜索希望收录高质量的中文新闻,不收录英文等其它非中文新闻。 5、请按照上面公布的开放协议内容制作XML文件。 支持的编码格式有GB2312、GB18030、UTF-8、BIG5,推荐使用GB18030或UTF-8格式。 您可以将网站某一时间段发布的全部新闻放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。 请保持每个XML文件处于按更新周期持续自动更新状态。更新周期可根据您的需要随时进行调整。 每个XML文件至多存放最新发布的100条新闻,<span>无需保存之前的新闻</span>。 请将发布的新闻按照时间排序,即最新发布的新闻在最上端,否则可能有新闻被遗漏。 XML标签内容中,除文字文本以外不能包含其它任何代码,下表中的特殊字符必须转换为XML定义的转义字符。否则将发生错误导致搜索引擎不能获取页面上的新闻。 <pre> 字符 转义后的字符 HTML字符 字符编码 和(and) & &amp; &#38; 单引号 ' &apos; &#39; 双引号 " &quot; &#34; 大于号 > &gt; &#62; 小于号 < &lt; &#60; 转义字符中的"&"无需再转。</pre><p> 建议您使用CDATA 部件。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束。将包含代码或特殊字符的文本置于CDATA 部件内 ,就无需再对特殊字符进行转义。 下面的地址提供了帮助您验证XML文件结构的多种工具:http://www.php.cn/http://www.php.cn/通过验证的XML文件能够使您提供的信息更加标准,确保您发布的新闻信息不被搜索引擎遗漏。提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。若您的网站符合新闻源收录标准,百度新闻搜索将对您提交的数据进行测试和观察一周。如果XML文件基本按照 《互联网新闻开放协议》的要求制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。 <strong>注意: </strong><strong> </strong>1、 我们将对您提交的XML文件进行审核,百度新闻搜索不保证一定能收录您提交的全部内容。 2、站点名、地址为必填项,同一站点一天之内最多提交5个不同的XML文件地址。 3、提交地址后请您注意查看弹出窗口中的信息,以确认是否提交成功。 <strong>第四步:查询XML文件状态</strong>您可以在下面的方框中输入您提交的XML文件地址,查询该文件的处理进度和反馈信息。 <strong>注意</strong>:输入的地址必须完整,即与您提交时的地址完全一致。</p><p>以上就是简单介绍百度新闻开放协议XML文档制作方法的详细内容,更多内容请关注技术你好其它相关文章!</p> </div> <div class="article-foot"> <div class="source"> 来源链接:<a rel="nofollow" target="_blank"></a> </div> <div class="declare"> 免责声明:<br> 1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险 <br>2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场 </div> <div class="tags">标签: <a target="_blank" class="tag-link" href="/tags.html?tid=4767">百度新闻,XML,文档制作</a> </div> <div class="article-nav"> <a href="/article.html?aid=2"> <span style="color:#666!important">上一篇:</span>php获取远程图片并下载保存到本地的方法分析 </a> <a href="/article.html?aid=10555"> <span style="color:#666!important">下一篇:</span>XML基本概念入门介绍 </a> </div> </div> </article> <div class="side-module relative-article"> <div class="module-title"> <h3>相关资讯</h3> </div> <div class="module-content"> <div class="article-list"> <ul> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=39998" title="java自定义错误异常"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201202/1606918875.jpeg" loading="lazy" alt="java自定义错误异常"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=39998" title="">java自定义错误异常</a> <p class="des"> <a target="_blank" href="/article.html?aid=39998">java自定义错误异常的方法:1、定义一个MyException类继承自Exception,在构造函数内通过super关键字将错误传递给Exception的构造函数中;2、通过throw关键字自己抛出异常即可。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=496">java</a> <a target="_blank" href="/tags.html?tid=14886">自定义异常</a> </span> <span class="time">19-11-14</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=39969" title="Java集合类框架的基本接口有哪些?"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201201/ee0b4bceb8ed669aa43ed8726c14a150.jpg" loading="lazy" alt="Java集合类框架的基本接口有哪些?"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=39969" title="">Java集合类框架的基本接口有哪些?</a> <p class="des"> <a target="_blank" href="/article.html?aid=39969">Java集合类框架的基本接口有两大接口:Collection 和Map ,一个元素集合,一个是键值对集合; 其中List和Set接口继承了Collection接口; HashMap 和HashTable实现了Map接口。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=496">java</a> </span> <span class="time">19-11-14</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=39965" title="PHP中自动加载原理以及__autoload的使用教程"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201202/1606920291.jpeg" loading="lazy" alt="PHP中自动加载原理以及__autoload的使用教程"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=39965" title="">PHP中自动加载原理以及__autoload的使用教程</a> <p class="des"> <a target="_blank" href="/article.html?aid=39965">PHP中自动加载的原理:new一个class的时候,PHP系统如果找不到这个类就会去自动调用本文件中的__autoload($class_name)方法,new的这个class_name就成为这个方法的参数。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=5">PHP</a> <a target="_blank" href="/tags.html?tid=496">java</a> </span> <span class="time">19-11-13</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=39882" title="什么是java手机"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201201/5c4985b58eb5a9513129ea29b93a78c9.jpg" loading="lazy" alt="什么是java手机"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=39882" title="">什么是java手机</a> <p class="des"> <a target="_blank" href="/article.html?aid=39882">java手机是以linux为主,采用了linux+java方式来运行应用程序的手机。手机软件由java语言开发,就称为java功能手机,它运行的应用程序都是以*.jar结尾的可执行文件。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=496">java</a> <a target="_blank" href="/tags.html?tid=987">手机</a> </span> <span class="time">19-11-13</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=27634" title="notepad 怎么运行python"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201201/4abfd97547021b7e564434284b55be3b.jpg" loading="lazy" alt="notepad 怎么运行python"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=27634" title="">notepad 怎么运行python</a> <p class="des"> <a target="_blank" href="/article.html?aid=27634">notepad运行python的方法:首先打开notepad并点击F5键,弹出运行对话框;接着在弹出的设置快捷键的对话框中,设置快捷键为【Ctrl+Shift+F5】;然后新建一个py文件并输入python命令;最后按快捷键运行即可。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=36" class="category">工具</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=12277">Notepad</a> </span> <span class="time">19-11-2</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=6496" title="python爬虫爬网页时遇到网页重定向怎么办"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201201/06729d69847b033e8ba3592f8c3a6466.jpg" loading="lazy" alt="python爬虫爬网页时遇到网页重定向怎么办"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=6496" title="">python爬虫爬网页时遇到网页重定向怎么办</a> <p class="des"> <a target="_blank" href="/article.html?aid=6496">爬取页面时会遇到网页重定向的情况,服务器端重定向可以在Request中将scrapy的参数进行更改来解决。网页中的标签声明了网页重定向的链接,这种重定向由浏览器完成,解决办法是通过得到跳转前的页面源码,从中提取出重定向url。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=10">Python</a> <a target="_blank" href="/tags.html?tid=3192">python爬网页时网页重定向</a> </span> <span class="time">19-6-28</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=3216" title="php8具体发布时间表一览!"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201201/6b4afe926871725b6beef46385343b78.jpg" loading="lazy" alt="php8具体发布时间表一览!"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=3216" title="">php8具体发布时间表一览!</a> <p class="des"> <a target="_blank" href="/article.html?aid=3216">PHP 8计划于2020年12月的第一周发布!Alpha的第一个版本已于2020年6月发布。像往常一样,这是查找错误,要求更改的好时机,并且仍有很短的时间可以提交您的更新。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">互联网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=5">PHP</a> <a target="_blank" href="/tags.html?tid=404">php8</a> </span> <span class="time">20-7-8</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=3" title="python 正则表达式获取字符串中所有的日期和时间"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201129/1606663798.jpeg" loading="lazy" alt="python 正则表达式获取字符串中所有的日期和时间"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=3" title="">python 正则表达式获取字符串中所有的日期和时间</a> <p class="des"> <a target="_blank" href="/article.html?aid=3">这篇文章主要介绍了python 正则表达式获取字符串中所有的日期和时间,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下提取日期前的处理1.处理文本数据的日期格式统一化12345</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">官网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=10">Python</a> <a target="_blank" href="/tags.html?tid=11">正则表达式</a> </span> <span class="time">20-11-29</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=2" title="php获取远程图片并下载保存到本地的方法分析"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201129/1606663381.jpeg" loading="lazy" alt="php获取远程图片并下载保存到本地的方法分析"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=2" title="">php获取远程图片并下载保存到本地的方法分析</a> <p class="des"> <a target="_blank" href="/article.html?aid=2">这篇文章主要介绍了php获取远程图片并下载保存到本地的方法,结合实例形式对比分析了php基于curl与缓存操作获取远程图片及图片保存的相关操作技巧,需要的朋友可以参考下本文实例讲述了php获取远程图片</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">官网</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=5">PHP</a> <a target="_blank" href="/tags.html?tid=8">获取图片</a> </span> <span class="time">20-11-29</span> </div> </div> </div> </li> <li> <div class="article"> <a class="cover" target="_blank" href="/article.html?aid=1" title="深入Storyteller:实时协同Tutorial编辑器"> <img onerror="imageLoadError(this)" src="https://jishunihao.com//upload/article/20201129/1606663489.jpeg" loading="lazy" alt="深入Storyteller:实时协同Tutorial编辑器"> </a> <div class="info"> <a class="title" target="_blank" href="/article.html?aid=1" title="">深入Storyteller:实时协同Tutorial编辑器</a> <p class="des"> <a target="_blank" href="/article.html?aid=1">在刚刚结束的 RTE 2020 创新挑战赛中我提交了名为 Storyteller 的作品,其功能是一个“实时协同的交互式 tutorial 编辑器”。在本文中我会深入 Storyteller 的技术细节,聊聊声网 Agora 的实时服务如何在这个场景下大放异彩。</a> </p> <div class="other"> <a target="_blank" href="/?category_id=7" class="category">后端</a> <span class="source"> <a target="_blank">玉刚说</a> </span> <span class="tags"> <a target="_blank" href="/tags.html?tid=1">音视频干货</a> <a target="_blank" href="/tags.html?tid=2">实时协同</a> </span> <span class="time">20-11-27</span> </div> </div> </div> </li> </ul> </div> </div> </div> </div> <div class="sub-content"> <div class="wechat-box ad"> <div class="info"> <strong>扫码关注公众号</strong> <p>技术文章 / 下载软件<br>趣味内容 / 专业带飞</p> <span>微信公众号: 每周好玩APP推荐</span> </div> <div class="imgbox"> <img src="https://jishunihao.com/static/index/common/image/wechat.jpg"> </div> </div> <div class="ad-box"> <a href="#" rel="nofollow" target="_blank"> <img src="https://jishunihao.com/static/index/common/image/ad.jpg"> </a> </div> <!-- 标签推荐 --> <div class="side-module side-tags-module"> <div class="module-title"><h3>标签推荐</h3></div> <div class="module-content"> <ul class="side-tags-list"> <li><a target="_blank" title="ThinkPHP" href="/tags.html?tid=4">ThinkPHP</a></li> <li><a target="_blank" title="php8" href="/tags.html?tid=404">php8</a></li> <li><a target="_blank" title="微信小程序" href="/tags.html?tid=2309">微信小程序</a></li> <li><a target="_blank" title="python3.8.5" href="/tags.html?tid=2641">python3.8.5</a></li> <li><a target="_blank" title="MSSQL2005" href="/tags.html?tid=6169">MSSQL2005</a></li> <li><a target="_blank" title="css定位" href="/tags.html?tid=6754">css定位</a></li> <li><a target="_blank" title="微信小程序web-view的使用" href="/tags.html?tid=10012">微信小程序web-view的使用</a></li> <li><a target="_blank" title="微信小程序,审核标准,下架标准" href="/tags.html?tid=10161">微信小程序,审核标准,下架标准</a></li> <li><a target="_blank" title="搭建微信小程序" href="/tags.html?tid=10742">搭建微信小程序</a></li> <li><a target="_blank" title="甘特图" href="/tags.html?tid=13125">甘特图</a></li> </ul> <a target="_blank" href="/collection.html" class="more">查看更多</a> </div> </div> </div> </div> <footer class="page-footer"> <div class="page-header-box"> <div class="footer-box-1"> <div class="footer-page"> <a href="#">关于我们</a> <a href="#">联系我们</a> <a href="#">免责声明</a> <!-- <a href="#">访问手机端</a> --> </div> <div class="footer-desc"> <p>如果您觉得此页面对您有所帮助</p> <p>Copyright© 2013-2020 技术你好 All Rights Reserved</p> <p><a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank">粤ICP备16052062号-3</a></p> </div> </div> <!-- <div class="footer-box-2"> <a href="#">Unix时间戳转换</a> <a href="#">URL编码/解码</a> <a href="#">代码对比/归并</a> <a href="#">代码格式化</a> </div> --> </div> </footer> <script src="https://jishunihao.com/static/index/common/js/jquery.min.js"></script> <script src="https://jishunihao.com/static/index/common/js/highlight.pack.js"></script> </body> </html>