-
Notifications
You must be signed in to change notification settings - Fork 51
/
Copy pathDataSetDeduplicationBenchmark.cs
95 lines (86 loc) · 2.86 KB
/
DataSetDeduplicationBenchmark.cs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
using BenchmarkDotNet.Attributes;
namespace BenchmarkDotNetExercise
{
[MemoryDiagnoser]//记录内存分配情况
public class DataSetDeduplicationBenchmark
{
private List<int> dataSource;
public DataSetDeduplicationBenchmark()
{
// 生成大量重复数据
dataSource = Enumerable.Repeat(Enumerable.Range(1, 100), 10000).SelectMany(x => x).ToList();
}
/// <summary>
/// 使用HashSet去重
/// TODO:HashSet是一个集合类,它的特点是不允许重复元素,可以方便地实现去重功能。
/// </summary>
[Benchmark]
public void HashSetDuplicate()
{
HashSet<int> uniqueData = new HashSet<int>(dataSource);
}
/// <summary>
/// 直接循环遍历去重
/// </summary>
[Benchmark]
public void LoopTraversalDuplicate()
{
var uniqueData = new List<int>();
foreach (var item in dataSource)
{
//if (!uniqueData.Any(x => x == item))
//if (!uniqueData.Exists(x => x == item))
if (!uniqueData.Contains(item))
{
uniqueData.Add(item);
}
}
}
/// <summary>
/// 使用Linq的Distinct()方法去重
/// </summary>
[Benchmark]
public void DistinctDuplicate()
{
var uniqueData = dataSource.Distinct().ToList();
}
/// <summary>
/// 使用Linq的GroupBy()方法去重
/// </summary>
[Benchmark]
public void GroupByDuplicate()
{
//GroupBy()方法将原始集合中的元素进行分组,根据指定的键或条件进行分组。每个分组都会有一个唯一的键,通过将原始集合分组并选择每个分组中的第一个元素,实现了去重的效果。
var uniqueData = dataSource.GroupBy(item => item).Select(group => group.First()).ToList();
}
/// <summary>
/// 使用自定义的比较器和循环遍历
/// </summary>
[Benchmark]
public void CustomEqualityComparerDuplicate()
{
var uniqueData = new List<int>();
foreach (var item in dataSource)
{
if (!uniqueData.Contains(item, new CustomEqualityComparer()))
{
uniqueData.Add(item);
}
}
}
/// <summary>
/// 自定义的比较器
/// </summary>
public class CustomEqualityComparer : IEqualityComparer<int>
{
public bool Equals(int x, int y)
{
return x == y;
}
public int GetHashCode(int obj)
{
return obj.GetHashCode();
}
}
}
}