golang自定义类型slice去重

方法一

package main

import (
	"fmt"
	"github.com/hyperjumptech/beda"
	"reflect"
	"strings"
)

func main() {
	//data := []string{"a", "b", "c", "d", "a", "c"}
	//fmt.Printf("%#v\n", DeDuplicate(data).([]string))
	data := []int{1, 2, 3, 4, 7, 2, 3}
	fmt.Printf("%#v\n", DeDuplicate(data).([]int))
}

// DeDuplicate 切片去重
func DeDuplicate(data interface{}) interface{} {
	inArr := reflect.ValueOf(data)
	if inArr.Kind() != reflect.Slice && inArr.Kind() != reflect.Array {
		return data
	}

	existMap := make(map[interface{}]bool)
	outArr := reflect.MakeSlice(inArr.Type(), 0, inArr.Len())

	for i := 0; i < inArr.Len(); i++ {
		iVal := inArr.Index(i)

		if _, ok := existMap[iVal.Interface()]; !ok {
			outArr = reflect.Append(outArr, inArr.Index(i))
			existMap[iVal.Interface()] = true
		}
	}

	return outArr.Interface()
}

方法二

package main

import (
	"fmt"
	"reflect"
)

func main() {
	//data := []string{"a", "b", "c", "d", "a", "c"}
	//fmt.Printf("%#v\n", DeDuplicate(data).([]string))
	//data1 := []int{1, 2, 3, 4, 7, 2, 3}
	//fmt.Printf("%#v\n", DeDuplicate(data1).([]int))

	strArr := []string{"11", "22", "22", "44", "44", "55"}
	DeduplicateOriginal(&strArr) //注意:是切片的指针
	fmt.Printf("%#v\n", strArr)
}

// DeDuplicate 切片去重
func DeDuplicate(data interface{}) interface{} {
	inArr := reflect.ValueOf(data)
	if inArr.Kind() != reflect.Slice && inArr.Kind() != reflect.Array {
		return data
	}

	existMap := make(map[interface{}]bool)
	outArr := reflect.MakeSlice(inArr.Type(), 0, inArr.Len())

	for i := 0; i < inArr.Len(); i++ {
		iVal := inArr.Index(i)

		if _, ok := existMap[iVal.Interface()]; !ok {
			outArr = reflect.Append(outArr, inArr.Index(i))
			existMap[iVal.Interface()] = true
		}
	}

	return outArr.Interface()
}

// DeduplicateOriginal 传入的data必须是 指向切片的指针
func DeduplicateOriginal(data interface{}) {

	dataVal := reflect.ValueOf(data)
	if dataVal.Kind() != reflect.Ptr {
		fmt.Println("input data.kind is not pointer")
		return
	}

	tmpData := DeDuplicate(dataVal.Elem().Interface())
	tmpDataVal := reflect.ValueOf(tmpData)

	dataVal.Elem().Set(tmpDataVal)
}

实现思路

具体类型的实现

通用往往是对个例的抽象,或者说是是归纳与演绎两大法宝之归纳法。
以对[]int64的去重为例:

func DedumplicateInt64(data []int64) []int64 {
    outArr := make([]int64, 0)
    existMap := make(map[int64]bool)

    for _, v := range data {
        if _, ok := existMap[v]; !ok {
            outArr = append(outArr, v)
            existMap[v] = true
        }
    }
    return outArr
}

小说明:这里的existMap其实就是充当set的作用。

利用反射实现方式一

怎样将上面的逻辑翻译成对下面通用interface的处理呢?

func Deduplicate(data interface{}) interface{} {}

答案是:反射!

因为interface中保存着 运行时 原数据的类型和值,
而反射的特性用于处理运行时才知道类型的数据再合适不过了。

interface和reflect.Value的互转

  • func ValueOf(i interface{}) Value
    该函数可以获取到Interface{}实际存储的值;
  • func (v Value) Interface() (i interface{})
    该函数可以将实际存储的值转化为interface{};

操作任意类型的slice

  • reflect.MakeSlice
  • reflect.Append

有了上面两个基础知识后,翻译也就水到渠成了。

从方式一到方式二

方式二修改原slice,节约空间的方法是用类似于quicksort的IN-PLACE算法,

但本文主要是探究语言层面的实现,因而对算法的优化有所忽略,
所以这里先调用方案一拿到去重后的结果,再修改原输入的slice。

怎么修改原slice,我还真的卡了好长时间!
注意点:slice的传参,是值传递!
所以要想修改原切片,传给参数的值必须是 指向切片的指针!
reflect.Value的两个重要函数

  • func (v Value) Elem() Value
// Elem returns the value that the interface v contains
// or that the pointer v points to.
// It panics if v's Kind is not Interface or Ptr.
// It returns the zero Value if v is nil.

所以Elem()相当于*ptr的作用,也就是解引用。

  • func (v Value) Set(x Value)

发散:从另一种实现看slice的内部结构

func DeduplicateOriginal(data interface{}) {

    dataVal := reflect.ValueOf(data)
    if dataVal.Kind() != reflect.Ptr {
        fmt.Println("input data.kind is not pointer")
        return
    }

    tmpData := Deduplicate(dataVal.Elem().Interface())
    tmpDataVal := reflect.ValueOf(tmpData)

    intArrP := (*reflect.SliceHeader)(unsafe.Pointer(dataVal.Pointer()))

    intArrP.Len = tmpDataVal.Len()
    intArrP.Cap = tmpDataVal.Cap()
    intArrP.Data = tmpDataVal.Pointer()
}

上面这种实现也是ok的。

因为slice实际上是下面这个结构:

// SliceHeader is the runtime representation of a slice.
// It cannot be used safely or portably and its representation may
// change in a later release.
// Moreover, the Data field is not sufficient to guarantee the data
// it references will not be garbage collected, so programs must keep
// a separate, correctly typed pointer to the underlying data.
type SliceHeader struct {
    Data uintptr
    Len  int
    Cap  int
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值