博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(2)搜索广告CTR预估
阅读量:7153 次
发布时间:2019-06-29

本文共 380 字,大约阅读时间需要 1 分钟。

 1. CTR预估的流程

数据 -》 预处理 -》特征抽取 -》模型训练 -》后处理

特征决定了达到好的评价指标的上限,模型决定了接近这个上限的程度。

2. 数据预处理

label匹配:展示日志和点击日志做一个join

采样: 负采样(广告点击率很低,随机丢弃一部分负样本

组合相关信息: 相关信息需要到别的文件中去找,所以需要组合相关信息。比如:如果需要查看某个query_id代表的是什么,需要去id号对应的txt中查询: cat queryid_tokensid.txt | awk '$1 == 14092{print $0}' | head

每次都这样操作会比较麻烦,所以需要直接把这些信息组合到训练数据中去。这就是数据预处理里面的特征组合:Join

 

转载于:https://www.cnblogs.com/Lee-yl/p/10936370.html

你可能感兴趣的文章
<Tag> tld的配置
查看>>
datesheet你看懂了吗?
查看>>
第一课 redis安装配置
查看>>
ASP.NET开源博客QBlog开发者视频教程:生命周期Page_Load介绍及简洁传递参数的...
查看>>
项目成功必要条件
查看>>
ECharts简介及入门
查看>>
亿级Web系统搭建:单机到分布式集群
查看>>
第五十讲:tapestry乱码问题Invalid byte 3 of 3-byte
查看>>
linux系统学习笔记之Linux环境变量
查看>>
【开源项目】之照明智能开关
查看>>
DB2 全库查询赋权
查看>>
glibc中的hsearch_r函数
查看>>
Android如何添加系统长按键功能
查看>>
将 开源中国 在线工具 制作成chrome的扩展程序
查看>>
第14章 结构和其他数据形式 14.13 奇特的声明
查看>>
svn服务器搭建
查看>>
Delphi图表控件TChart使用
查看>>
《Spring Boot系列》- 目录
查看>>
测者的性能测试手册:SWAP的监控
查看>>
Saas应用服务战升级中小企业发展走入新的拐点
查看>>