达观数据旨在为用户提供文本挖掘、智能推荐引擎、搜索引擎、微信抓取等方面的大数据技术服务，用户在使用达观服务后即可在数据大师平台看到各功能模块全面且详细的数据报告。本文以文本挖掘和微信抓取两大模块为例进行介绍，欲了解更多，欢迎注册数据大师账户或直接联系我们客服人员。

智能推荐引擎

智能推荐引擎旨在为用户提供使用推荐功能后的各项数据汇总，允许用户根据自己的需要来进行一些产品的禁止推荐和固定推荐。

接入流程

达观以SaaS服务的形式将专业搜索技术简单化、低门槛化和低成本化，客户只需简单几步数据接入，即可使用专属的产品智能搜索功能。
第一步：开通账号，获取AppId和AppName
企业购买达观搜索引擎服务后，获得达观大数据平台专属账号和密码。登录后可以查看后台账号相关信息。

登录达观大数据平台后，在账户中心>应用设置中获取自己的应用信息。每位用户都有一个AppId和AppName作为唯一用户标识，也是后续调取搜索引擎服务API的必备参数。
为了安全起见，用户需要在应用设置中将自己的服务器IP加入白名单。达观系统只允许在IP白名单中的服务器进行调用，保证用户的服务和数据安全。

第二步：搜索接入配置
开通账号并获取应用信息后，用户需要根据自身需求，在达观大数据平台设置接入搜索引擎的所有配置，包括数据格式配置、数据导入、接入状态查看等。

第三步：上报数据
完成搜索接入配置后，用户需要上报数据，上报数据是接入达观大数据服务的基础。
数据可通过HTTP或者SDK两种方式上传，其中HTTP方式（主要方式）适合用于进行单条的、增量的方式上传，或者单条数据的修改、删除等操作，使用者也可以将批量数据，拆分为单条后使用HTTP方式来发送；SDK适合进行大批量的数据的上传。
数据上报文档http://doc.datagrand.com/developer/data-report
第四步：接口调用
完成数据上报后，即可开始调用达观数据搜索引擎接口，接口包括关键词搜索服务、自动补全服务、相关搜索服务请求和热门搜索词接口。

搜索配置

用户可以在达观大数据平台中进行搜索配置，登录达观大数据平台，点击搜索引擎菜单下的“搜索配置”，进入搜索配置功能。

检索字段配置

检索字段是指用户输入的搜索词（关键词搜索接口中的query参数的值）可以进行匹配命中的字段，系统默认可检索字段是标题字段和标签字段。您也可以根据业务需求添加其它字段作为可检索字段，比如描述、品牌等字段。在指定检索字段时，您可以调整搜索词与检索字段的匹配权重。匹配权重是指检索字段与用户搜索词进行匹配的重要程度，字段的匹配权重越高，则匹配命中时进行排序的相关性分值越高。系统提供的匹配权重有最高、高、低三种。字段的匹配权重可以根据业务需要进行设置，比如标题的重要程度通常比描述高。

指定字段排序配置

指定字段排序是指用户用指定的字段对搜索结果进行排序，比如根据价格进行排序或根据评论数进行排序等(对应于关键词搜索接口中的sort参数)。常见的指定字段排序的字段有阅读数、点赞数、评论数、播放数、成交数、价格、发布时间、上架时间等。
注：排序字段只支持数值类型字段。

综合排序配置

综合排序是指搜索引擎排序算法根据搜索词与检索字段的相关性分、物品(item)的质量分以及搜索词对物品的点击概率综合计算出的一个用于排序的分值进行排序。综合排序是默认的排序方式，除非用户指定字段进行排序。
其中用于综合排序的物品质量分是根据您定义的综合排序字段值进行归一化处理后再加权计算而得。
用户可以创建不超过10个综合排序字段, 常见的综合排序字段例如阅读数、点赞数、评论数、成交数、好评指数等。注：综合排序字段只支持数值类型字段，权重可选范围为1-9

筛选字段配置

搜索引擎支持用户对召回结果可以进行更进一步的筛选，比如根据价格区间进行筛选、根据发布时间进行筛选。筛选字段支持多值(分号隔开,如”北京;上海;深圳”)。常见的筛选字段有阅读数、点赞数、评论数、播放数、成交数、价格、发布时间、上架时间、品牌、产地、类目、状态等。
用户在这里设置可以进行搜索结果筛选的字段（对应关键词搜索接口中的filter参数或range参数）

自动提示字段配置

自动提示(又称autosuggest)是指用户在搜索框输入部分搜索词时搜索引擎自动提示与此相关的完整的搜索词列表，用户可点列表中的搜索词直接进行搜索。自动提示候选词主要来自用户的搜索日志，您也可以设置相关字段作为自动提示的候选词，比如物品的标签、品牌等字段。
注意自动提示字段只支持字符型字段。

返回字段配置

达观搜索默认返回匹配到的物品ID(itemid)字段，您也可以在关键词搜索接口中的fields参数指定返回所有已经设置的匹配字段，排序字段以及筛选字段。除此之外，您还可以在此设置其他需要搜索引擎能够返回的字段。
注：返回字段需要在已经上报的字段中。

高亮字段配置

高亮字段是指搜索结果返回的用于显示高亮命中的搜索词所在的字段，比如标题字段或描述字段。注意高亮字段只支持字符型字段。

聚合统计配置

聚合统计是指对搜索结果按指定属性字段进行数目统计, 便于用户对搜索结果进行属性筛选。您可以在此设置属性字段(比如品牌、产地、类目等)进行聚合统计。支持对数值型和非多值的字符型字段进行聚合统计。

API调用

搜索引擎接口文档http://doc.datagrand.com/developer/search-engine

数据统计

搜索使用情况

统计每天使用搜索功能的人数（UV），搜索功能被使用的次数（PV），搜索结果被点击的次数，以及结果点击率。用户可以通过筛选条件——时间区段和场景（如IOS、PC或者安卓等）；点击折线图下方的图例，可以选择展示的数据；在折线图下方，以列表形式展示一段时间内，每天的搜索次数、搜索人数、搜索点击数和结果点击率；点击数据列表中的“查看”，可查看当天的搜索数据来源分布。