using System;
using System.Collections.Generic;
using System.Text;
using https://www.sodocs.net/doc/cf9323064.html,;
using System.IO;
namespace Czt.Web
{
///
/// 实现网站登录类
///
public class Post
{
///
/// 网站Cookies
///
private string _cookieHeader = string.Empty;
public string CookieHeader
{
get
{
return _cookieHeader;
}
set
{
_cookieHeader = value;
}
}
///
/// 网站编码
///
private string _code = string.Empty;
public string Code
{
get { return _code; }
set { _code = value; }
}
private string _pageContent = string.Empty;
public string PageContent
{
get { return _pageContent; }
set { _pageContent = value; }
}
private Dictionary
public Dictionary
{
get { return _para; }
set { _para = value; }
}
/**/
///
/// 功能描述:模拟登录页面,提交登录数据进行登录,并记录Header中的cookie
///
/// 登录数据提交的页面地址
/// 用户登录数据
/// 引用地址
/// 网站编码
///
public string PostData(string strURL, string strArgs, string strReferer, string code, string method)
{
return PostData(strURL, strArgs, strReferer, code, method, string.Empty);
}
public string PostData(string strURL, string strArgs, string strReferer, string code, string method, string contentType)
{
try
{
string strResult = "";
HttpWebRequest myHttpWebRequest =
(HttpWebRequest)WebRequest.Create(strURL);
myHttpWebRequest.AllowAutoRedirect = true;
myHttpWebRequest.KeepAlive = true;
myHttpWebRequest.Accept = "image/gif, image/x-xbitmap, image/jpeg,
image/pjpeg, application/vnd.ms-excel, application/msword, application/x-shockwave-flash, */*";
myHttpWebRequest.Referer = strReferer;
https://www.sodocs.net/doc/cf9323064.html,erAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; .NET CLR 2.0.50727)";
if (string.IsNullOrEmpty(contentType))
{
myHttpWebRequest.ContentType = "application/x-www-form-urlencoded";
}
else
{
myHttpWebRequest.ContentType = "contentType";
}
myHttpWebRequest.Method = method;
myHttpWebRequest.Headers.Add("Accept-Encoding", "gzip, deflate");
if (myHttpWebRequest.CookieContainer == null)
{
myHttpWebRequest.CookieContainer = new CookieContainer();
}
if (this.CookieHeader.Length > 0)
{
myHttpWebRequest.Headers.Add("cookie:" + this.CookieHeader);
myHttpWebRequest.CookieContainer.SetCookies(new Uri(strURL), this.CookieHeader);
}
byte[] postData = Encoding.GetEncoding(code).GetBytes(strArgs);
myHttpWebRequest.ContentLength = postData.Length;
System.IO.Stream PostStream = myHttpWebRequest.GetRequestStream();
PostStream.Write(postData, 0, postData.Length);
PostStream.Close();
HttpWebResponse response = null;
System.IO.StreamReader sr = null;
response = (HttpWebResponse)myHttpWebRequest.GetResponse();
if (myHttpWebRequest.CookieContainer != null)
{
this.CookieHeader =
myHttpWebRequest.CookieContainer.GetCookieHeader(new Uri(strURL));
}
sr = new System.IO.StreamReader(response.GetResponseStream(), Encoding.GetEncoding(code)); // //utf-8
strResult = sr.ReadToEnd();
sr.Close();
response.Close();
return strResult;
}
catch (Exception ex)
{
Utilities.Document.Create("C:\\error.log", strArgs, true, Encoding.UTF8);
}
return string.Empty;
}
/**/
///
/// 功能描述:在PostLogin成功登录后记录下Headers中的cookie,然后获取此网站上其他页面的内容
///
/// 获取网站的某页面的地址
/// 引用的地址
///
public string GetPage(string strURL, string strReferer, string code)
{
return GetPage(strURL, strReferer,code,string.Empty);
}
public string GetPage(string strURL, string strReferer,string code,string contentType) {
string strResult = "";
HttpWebRequest myHttpWebRequest =
(HttpWebRequest)WebRequest.Create(strURL);
myHttpWebRequest.AllowAutoRedirect = true;
myHttpWebRequest.KeepAlive = false;
myHttpWebRequest.Accept = "*/*";
myHttpWebRequest.Referer = strReferer;
myHttpWebRequest.Headers.Add("Accept-Encoding", "gzip, deflate");
https://www.sodocs.net/doc/cf9323064.html,erAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; .NET CLR 2.0.50727)";
if (string.IsNullOrEmpty(contentType))
{
myHttpWebRequest.ContentType = "application/x-www-form-urlencoded";
}
else
{
myHttpWebRequest.ContentType = contentType;
}
myHttpWebRequest.Method = "GET";
if (myHttpWebRequest.CookieContainer == null)
{
myHttpWebRequest.CookieContainer = new CookieContainer();
}
if (this.CookieHeader.Length > 0)
{
myHttpWebRequest.Headers.Add("cookie:" + this.CookieHeader);
myHttpWebRequest.CookieContainer.SetCookies(new Uri(strURL),
this.CookieHeader);
}
HttpWebResponse response = null;
System.IO.StreamReader sr = null;
response = (HttpWebResponse)myHttpWebRequest.GetResponse();
Stream streamReceive;
string gzip = response.ContentEncoding;
if (string.IsNullOrEmpty(gzip) || gzip.ToLower() != "gzip")
{
streamReceive = response.GetResponseStream();
}
else
{
streamReceive = new
https://www.sodocs.net/doc/cf9323064.html,pression.GZipStream(response.GetResponseStream(),
https://www.sodocs.net/doc/cf9323064.html,pressionMode.Decompress);
}
sr = new System.IO.StreamReader(streamReceive, Encoding.GetEncoding(code));
if (response.ContentLength > 1)
{
strResult = sr.ReadToEnd();
}
else
{
char[] buffer=new char[256];
int count = 0;
StringBuilder sb = new StringBuilder();
while ((count = sr.Read(buffer, 0, buffer.Length)) > 0)
{
sb.Append(new string(buffer));
}
strResult = sb.ToString();
}
sr.Close();
response.Close();
return strResult;
}
}
}
windows服务器NTP自动对时服务 开启方法和应用 第1章开启服务器NTP服务 1.打开系统“服务”选项,双击打开“Windows Time”服务 2.在系统服务中设置W32Time服务启动模式为自动 3.点击运行或者win+R调出运行窗口,输入regedit打开Windows注册表
4.在注册表找到如下位置 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Ti me\Config 找到AnnounceFlags 双击修改值为5保存 5.在注册表找到如下位置 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Ti me\TimeProviders\NtpServer
找到Enable并修改其值为1 6.键盘“win+R”,打开系统CMD命令(注意一定要以管理员身份运行) 在命令提示符中输入:net stop w32Time,回车等待NTP服务停止。 然后再输入:net start w32Time,回车启动NTP服务。
7.系统提示“Windows Time 服务已经启动成功”即说明NTP服务已正常启 动。 第2章设置硬盘录像机的NTP自动对时服务 1)硬盘录像机须和服务器设置在同一网段。 2)登录硬盘录像机后台,找到“系统设置”→“时间配置”→“NTP校时” 3)输入服务器的IP,NTP端口固定为123,校时时间间隔设置为1分钟。 4)设置完成后,等待一分钟硬盘录像机的时间自动与服务器时间同步,说 明NTP功能开启成功。 第3章其他应用方向 1)为其他局域网内的电脑提供授时功能。 2)能为局域网内摄像头提供NTP授时服务(摄像头须支持NTP功能)。
服务器基本安全配置 1.用户安全 (1)运行lusrmgr.msc,重命名原Administrator用户为自定义一定长度的名字,并新建同名 Administrator普通用户,设置超长密码去除所有隶属用户组。 (2)运行gpedit.msc——计算机配置—安全设置—账户策略—密码策略 启动密码复杂性要求,设置密码最小长度、密码最长使用期限,定期修改密码保证服务器账户的密码安全。 (3)运行gpedit.msc——计算机配置—安全设置—账户策略—账户锁定策略 启动账户锁定,设置单用户多次登录错误锁定策略,具体设置参照要求设置。
(4)运行gpedit.msc——计算机配置—安全设置—本地策略—安全选项 交互式登录:不显示上次的用户名;——启动 交互式登录:回话锁定时显示用户信息;——不显示用户信息 (5)运行gpedit.msc——计算机配置—安全设置—本地策略—安全选项 网络访问:可匿名访问的共享;——清空 网络访问:可匿名访问的命名管道;——清空 网络访问:可远程访问的注册表路径;——清空 网络访问:可远程访问的注册表路径和子路径;——清空 (6)运行gpedit.msc——计算机配置—安全设置—本地策略 通过终端服务拒绝登陆——加入一下用户(****代表计算机名)ASPNET Guest IUSR_***** IWAM_***** NETWORK SERVICE SQLDebugger 注:用户添加查找如下图:
(7)运行gpedit.msc——计算机配置—安全设置—本地策略—策略审核 即系统日志记录的审核消息,方便我们检查服务器的账户安全,推荐设置如下: (8)
国内主要信息抓取软件盘点 近年来,随着国内大数据战略越来越清晰,数据抓取和信息采集系列产品迎来了巨大的发展 机遇,采集产品数量也出现迅猛增长。然而与产品种类快速增长相反的是,信息采集技术相 对薄弱、市场竞争激烈、质量良莠不齐。在此,本文列出当前信息采集和数据抓取市场最具 影响力的六大品牌,供各大数据和情报中心建设单位采购时参考: TOP.1 乐思网络信息采集系统 乐思网络信息采系统的主要目标就是解决网络信息采集和网络数据抓取问题。是根据用户自定义的任务配置,批量而精确地抽取因特网目标网页中的半结构化与非结构化数据,转化为结构化的记录,保存在本地数据库中,用于内部使用或外网发布,快速实现外部信息的获取。 主要用于:大数据基础建设,舆情监测,品牌监测,价格监测,门户网站新闻采集,行业资讯采集,竞争情报获取,商业数据整合,市场研究,数据库营销等领域。 TOP.2 火车采集器 火车采集器是一款专业的网络数据采集/信息挖掘处理软件,通过灵活的配置,可以很轻松迅速地从网页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站后台,各类文件或其他数据库系统中。被广泛应用于数据采集挖掘、垂直搜索、信息汇聚和门户、企业网信息汇聚、商业情报、论坛或博客迁移、智能信息代理、个人信息检索等领域,适用于各类对数据有采集挖掘需求的群体。 TOP.3 熊猫采集软件 熊猫采集软件利用熊猫精准搜索引擎的解析内核,实现对网页内容的仿浏览器解析,在此基础上利用原创的技术实现对网页框架内容与核心内容的分离、抽取,并实现相似页面的有效比对、匹配。因此,用户只需要指定一个参考页面,熊猫采集软件系统就可以据此来匹配类似的页面,来实现用户需要采集资料的批量采集。 TOP.4 狂人采集器 狂人采集器是一套专业的网站内容采集软件,支持各类论坛的帖子和回复采集,网站和博客文章内容抓取,通过相关配置,能轻松的采集80%的网站内容为己所用。根据各建站程序
怎么实现定时开机的: 计算机启动时按“Delete”键进入BIOS界面。在BIOS设置主界面中选择“Power Management Setup”菜单,进入电源管理窗口。 默认情况下,“Resume By Alarm)选项是关闭的,也就是disable的,将光标移到该项,用PageUp或PageDown翻页键或按enter键,选择Enabled,将“Disabled”改为“Enabled”,再在”Date (of Month)Alarm”和“Time (hh:mm:ss)Alarm”中设定开机的日期和时间。 注意如果你把“Date”设为0,则默认为每天定时开机。设置好后按“F10“保存设置就可以了,机器会重新启动,而你的自动开机设置也便大功告成了。 不过不同的主板在设置上会不尽相同,但都大同小异。,你只要安装这里的相关介绍并且对照主板说明书操作的话应该是没有任何问题的。 怎么实现定时关机:下面介绍两种方法:第一种方法:使用shutdown命令下面以23:00定时关机来说明。打开“运行“对话框,输入命令”at 23:00 shutdown -s -t 60“(表示到23:00后再等60秒关机,这可以由你自己设定),其实这是一个”关机‘的计划任务,你可以看到,输完命令回车后在计划任务里添加了一项,如果要重复执行一个任务,则可以使用every参数。该参数支持日期和星期的表示方式,例如at 00:15 /every:M,T,W,Th,F,S,Su shutdown -s -f,该命令表示每个周一到周日都执行该命令,也可以使用/evert:1,3,5,7,9等日期方式。 第二种方法:单击“开始”按钮,在“开始”菜单中选择“程序”选项,在“程序”中选择“附件”,再在“附件”中选择“系统工具”,在“系统工具”中选择“计划任务”命令,这时就打开了“计划任务”窗口,在该窗口中,点击“添加已计划的任务”进入“计划任务”向导。按照提示点击“下一步”后,再点击“浏览”按钮,找到“C:\Windows\Rundll32.exe”打开,然后根据自己的需求设置任务执行的方式,如每天或每周。最后设置好这个任务开始的时间和开始的日期,点击“完成”按钮就会在计划任务窗口出现“Rundll32”这个计划任务名。 1、开机:bios设置里应该有定时开机的选项 2、关机:用windows的计划任务定时执行shutdown指令,shutdown指令的说明如下 Microsoft Windows [版本 5.2.3790] (C) 版权所有1985-2003 Microsoft Corp. C:\Documents and Settings\Administrator>shutdown /?
网页抓取工具如何进行http模拟请求 在使用网页抓取工具采集网页是,进行http模拟请求可以通过浏览器自动获取登录cookie、返回头信息,查看源码等。具体如何操作呢?这里分享给大家网页抓取工具火车采集器V9中的http模拟请求。许多请求工具都是仿照火车采集器中的请求工具所写,因此大家可以此为例学习一下。 http模拟请求可以设置如何发起一个http请求,包括设置请求信息,返回头信息等。并具有自动提交的功能。工具主要包含两大部分:一个MDI父窗体和请求配置窗体。 1.1请求地址:正确填写请求的链接。 1.2请求信息:常规设置和更高级设置两部分。 (1)常规设置: ①来源页:正确填写请求页来源页地址。 ②发送方式:get和post,当选择post时,请在发送数据文本框正确填写发布数据。 ③客户端:选择或粘贴浏览器类型至此处。 ④cookie值:读取本地登录信息和自定义两种选择。 高级设置:包含如图所示系列设置,当不需要以上高级设置时,点击关闭按钮即可。 ①网页压缩:选择压缩方式,可全选,对应请求头信息的Accept-Encoding。 ②网页编码:自动识别和自定义两种选择,若选中自定义,自定义后面会出现编
码选择框,在选择框选择请求的编码。 ③Keep-Alive:决定当前请求是否与internet资源建立持久性链接。 ④自动跳转:决定当前请求是否应跟随重定向响应。 ⑤基于Windows身份验证类型的表单:正确填写用户名,密码,域即可,无身份认证时不必填写。 ⑥更多发送头信息:显示发送的头信息,以列表形式显示更清晰直观的了解到请求的头信息。此处的头信息供用户选填的,若要将某一名称的头信息进行请求,勾选Header名对应的复选框即可,Header名和Header值都是可以进行编辑的。 1.3返回头信息:将详细罗列请求成功之后返回的头信息,如下图。 1.4源码:待请求完毕后,工具会自动跳转到源码选项,在此可查看请求成功之后所返回的页面源码信息。 1.5预览:可在此预览请求成功之后返回的页面。 1.6自动操作选项:可设置自动刷新/提交的时间间隔和运行次数,启用此操作后,工具会自动的按一定的时间间隔和运行次数向服务器自动请求,若想取消此操作,点击后面的停止按钮即可。 配置好上述信息后,点击“开始查看”按钮即可查看请求信息,返回头信息等,为避免填写请求信息,可以点击“粘贴外部监视HTTP请求数据”按钮粘贴请求的头信息,然后点击开始查看按钮即可。这种捷径是在粘贴的头信息格式正确的前提下,否则会弹出错误提示框。 更多有关网页抓取工具或网页采集的教程都可以从火车采集器的系列教程中学习借鉴。
运维服务器登录规范 1.1终端使用规范 为了保证运维工作的严谨性和安全性,运维人员必须养成以下几个良好的习惯: 1、无论何时、何事、何种原因,离开座位必须锁定屏幕,保证电脑终端的安全; 2、电脑必须安装杀毒软件和木马防火墙。 1.2服务器登录规范 1、目前统一使用Xshell和SecureCRT管理服务器,请勿使用其他破解版本; 2、客户端连接服务器的时候,严禁自动登录功能; 3、根据用户和用户组做权限管理,严格控制服务器登录权限。 1.3服务器管理规范 1、在服务器上不允许使用rm命令,遇到确实不用的文件需使用mv filename/tmp的方式,将文件放入/tmp目录下,由系统自动删除; 2、对于没有经过验证的命令绝不允许在服务器上运行,必须完全理解该命令执行后的结果方可执行,执行命令时必须确定当前的工作目录; 3、修改配置文件必须备份,如cp filenamefilename_20151221,然后进行修改; 4、任何更改系统环境变量、参数设置的操作,需在测试环境下验证后执行; 5、管理员尽量使用sudo,而避免使用root用户操作。 1.4日志记录 运维日志是运维工程师每天必须进行登记的内容之一,由时间、日常工作、监控故障、响应故障、未完成工作、注意事项等项目组成,用来将每天的主要工作和处理的问题进行详细登记,便于总结工作和以后查询。日志功能待上线。 1.5测试评估 对于开源的软件,安装前必须进行一个周期的上线前的测试评估,评估该软件的功能、使用和安全性。服务器拒绝使用破解类型的软件,减少不必要的法律纠纷。
测试评估分为以下步骤进行: 1、内部测试服务器测试,评估其功能是否可以达到要求; 2、申请测试服务器,进行在线测试,并整理详细安装部署和管理文档; 3、在线运行,加入监控平台进行统计监控。 1.6账号管理 1、只有授权用户才可以申请系统账号,账号相应的权限应该以满足用户需要为原则,不得有与用户职责无关的权限; 2.、一人一账号,以便将用户与其操作联系起来,使用户对其操作负责; 3.、管理员必须维护对注册使用服务的所有用户的正式记录; 4、用户因工作变更或离开公司时,管理员要及时取消或者锁定其所有账号,对于无法锁定或者删除的用户账号采用更改口令等相应的措施规避该风险; 5、管理员应定期检查并取消多余的用户账号。 1.7 口令选取规范 1、用户应该有意识地选择强壮的口令(即难以破解和猜测的口令),不要使用弱口令; 2、用户应保证口令安全,不得向其他任何人泄漏。即使是出差或休假时,也不应将自己口令告诉他人; 3、至少3个月更改一次口令; 4、应避免在纸上记录口令,或以明文方式记录计算机内; 5、一旦有迹象表明系统或口令可能遭到破坏时,应立即更改; 6、如忘记个人密口令需经批准后由管理员重置口令后方可使用。
百度贴吧内容抓取工具-让你的网站一夜之间内容丰富 [hide]
var $getreplytime=1; var $showimg=1; var $showcon=1; var $showauthor=1; var $showreplytime=1; var $showsn=0; var $showhr=0; var $replylista=array(); var $pat_reply="<\/a>(.+?)
<\/td>\r\n<\/tr><\/table>"; var $pat_pagecount="尾页<\/font><\/a>"; var $pat_title="(.+?)<\/font>"; var $pat_replycon="<\/td>\r\n \r\n