Edgar-java学习--转换流和序列化相关问题

package 标准输入输出;

  • 一、标准输入输出流

  • 1.标准输入流 inputstream

  • 2.标准输出流 printStream

  • 二、转换流

  • 1.outputstreamwriter 将字节输出转换为字符输出流

  • 字节流的话操作的空间不大,但是识别的文件适用范围很大

  • 字符操作的话 换行之类的 输出一行之类的 主要是对中文有较好的识别

  • 三、对象操作流

  • 我们可以把对象存到文件里

  • 1.方便存储 传输速度快 安全

  • 1.1 序列化的对象的类要实现序列化接口

  • 1.2 序列化的对象要注意版本号的变更 防止输出异常

public class Demo1 {
   public static void main(String[] args) throws IOException, ClassNotFoundException {
   	// 一
   	// 我们常常使用的输入流就是一种标准输入输出流
   	InputStream inputStream = System.in;
   	Scanner scanner = new Scanner(inputStream);

   	final PrintStream printStream = null;
   	// 这个out返回值就是一个 printStream System.out
   	// system这个类封装我们有这个输出流
   	// 输出流里面有各种输出方法
   	// 所以我们这样使用也是可以的
   	//printStream.println();

   	// 二
   	// 这个就是一个字节输出流 向其中写入的时候只能写入字节
   	OutputStream outputStream = new FileOutputStream("1.txt");
   	// 这个就是将字节输出流转换为字符输出流
   	OutputStreamWriter outputStreamWriter = new OutputStreamWriter(outputStream);
   	// 再向其中写入字符就方便了 读取也是一样的
   	outputStreamWriter.write("这一块");

   	// 三
   	// 对象操作流 比较适合我们对对象操作
   	Student s1 = new Student(1,2);
   	
   	/*先将序列的接口接到要实现序列化的类中
   	 * 要注意添加版本号
   	 * public class Student implements Serializable {
   	 * 
   	 * private static final long serialVersionUID = 1L;
   	 */
   	// 序列化流 用于将对象写入文件中 
   	//先创造一个文件把对象写进去 序列化过程
   	File file=new  File("object.txt");
   	file.createNewFile();
   	OutputStream file2=new FileOutputStream(file);
   	//这个构造器需要传入字节的输入输出流
   	ObjectOutputStream objectOutputStream=new ObjectOutputStream(file2);
   	objectOutputStream.writeObject(s1);
   	
   	// 反序列化流 用于从文件中读取对象
   	//再把刚才我们写入的对象从文件读出来
   	InputStream inputStream2=new FileInputStream("object.txt");
   	ObjectInputStream objectInputStream=new ObjectInputStream(inputStream2);
   	Student s2=(Student) objectInputStream.readObject();
   	System.out.println(s2);
   	//备注 我们使用序列话的时候要注意对象版本问题 
   	//在类里面第一行加上版本号之后相当于加上一个id 这样我们再进行改动的时候jvm会用相应id读取对象 不会出现版本不一致的问题
   }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提取EDGAR 10-K文件中的文本数据是通过自动化和机器学习技术实现的。EDGAR是美国证券交易委员会(SEC)提供的一个公开的电子数据管理系统,其中包含了上市公司提交给SEC的各种文件,包括10-K报告。 首先,我们需要使用网络爬虫技术从EDGAR数据库中下载所需的10-K文件。爬虫程序按照特定的规则访问EDGAR网站上的公司文件列表,获取目标公司的10-K文件链接,并将这些链接保存下来。 接下来,我们使用数据抽取技术对已下载的10-K文件进行解析。这通常涉及到使用自然语言处理(NLP)技术,如文本标记、语义分析和实体识别等,以从文本数据中提取有用的信息。例如,我们可能需要提取公司的财务数据、管理层讨论与分析、风险因素等。 在提取文本数据之后,我们可能需要使用数据清洗和预处理技术对数据进行处理。这可以包括去除无用的标点符号和停用词,进行词干提取和拼写纠正,以及处理缺失值和异常值等。 最后,在数据准备和处理完毕后,我们可以将提取的文本数据用于各种目的。例如,可以进行文本分析和情感分析来了解公司的业绩和市场趋势,或者进行机器学习任务,如文本分类、命名实体识别或信息提取等。 总而言之,提取EDGAR 10-K文件中的文本数据是一个复杂的过程,需要使用Web爬虫、自然语言处理和数据清洗等技术来实现。这些数据可以帮助我们了解上市公司的财务状况和经营情况,并为后续的分析和决策提供有用的信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值