PHP与Golang管道通信模式

字号+ 编辑: IT男在阿里 修订: 种花家 来源: Go语言学习网 2023-09-22 我要说两句(1)

对phper来说很有参考价值的一篇文章

最近遇到的一个场景:php项目中需要使用一个第三方的功能(结巴分词),而github上面恰好有一个用Golang写好的类库。那么问题就来了,要如何实现不同语言之间的通信呢?

常规的方案:

  1. 用Golang写一个http/TCP服务,php通过http/TCP与Golang通信

  2. 将Golang经过较多封装,做为php扩展。

  3. PHP通过系统命令,调取Golang的可执行文件

存在的问题:

  1. http请求,网络I/O将会消耗大量时间

  2. 需要封装大量代码

  3. PHP每调取一次Golang程序,就需要一次初始化,时间消耗很多

优化目标:

  1. Golang程序只初始化一次(因为初始化很耗时)

  2. 所有请求不需要走网络

  3. 尽量不大量修改代码

解决方案:

  1. 简单的Golang封装,将第三方类库编译生成为一个可执行文件

  2. PHP与Golang通过双向管道通信

使用双向管道通信优势:

1:只需要对原有Golang类库进行很少的封装

2:性能最佳 (IPC通信是进程间通信的最佳途径)

3:不需要走网络请求,节约大量时间

4:程序只需初始化一次,并一直保持在内存中

具体实现步骤:

1:类库中的原始调取demo

package main
import (
    "fmt"
    "github.com/yanyiwu/gojieba"
    "strings"
)
func main() {
    x := gojieba.NewJieba()
    defer x.Free()
    s := "小明硕士毕业于中国科学院计算所,后在日本京都大学深造"
    words := x.CutForSearch(s, true)
    fmt.Println(strings.Join(words, "/"))
}

保存文件为main.go,就可以运行

2:调整后代码为:

package main

import (
    "bufio"
    "fmt"
    "github.com/yanyiwu/gojieba"
    "io"
    "os"
    "strings"
)

func main() {

    x := gojieba.NewJieba(
        "/data/tmp/jiebaDict/jieba.dict.utf8",
        "/data/tmp/jiebaDict/hmm_model.utf8",
        "/data/tmp/jiebaDict/user.dict.utf8"
    )

    defer x.Free()

    inputReader := bufio.NewReader(os.Stdin)

    for {
        s, err := inputReader.ReadString('\n')
        if err != nil && err == io.EOF {
            break
        }

        s = strings.TrimSpace(s)

        if s != "" {
            words := x.CutForSearch(s, true)
            fmt.Println(strings.Join(words, " "))
        } else {
            fmt.Println("get empty \n")
        }
    }
}

只需要简单的几行调整,即可实现:从标准输入接收字符串,经过分词再输出

测试:

# go build test
# ./test
# //等待用户输入,输入”这是一个测试“
# 这是 一个 测试 //程序

3:使用cat与Golang通信做简单测试

 准备一个title.txt,每行是一句文本

# cat title.txt | ./test

正常输出,表示cat已经可以和Golang正常交互了

4:PHP与Golang通信

以上所示的cat与Golang通信,使用的是单向管道。即:只能从cat向Golang传入数据,Golang输出的数据并没有传回给cat,而是直接输出到屏幕。但文中的需求是:php与Golang通信。即php要传数据给Golang,同时Golang也必须把执行结果返回给php。因此,需要引入双向管道。

在PHP中管道的使用:popen("/path/test"),具体就不展开说了,因为此方法解决不了文中的问题。

双向管道:

     $descriptorspec = array(
          0 => array("pipe", "r"),
            1 => array("pipe", "w")
      );
      $handle = proc_open(
          '/webroot/go/src/test/test',
          $descriptorspec,
          $pipes
      );
      fwrite($pipes['0'], "这是一个测试文本\n");
      echo fgets($pipes[1]);

解释:使用proc_open打开一个进程,调用Golang程序。同时返回一个双向管道pipes数组,php向$pipe['0']中写数据,从$pipe['1']中读数据。

好吧,也许你已经发现,我是标题档,这里重点要讲的并不只是PHP与Golang如何通信。而是在介绍一种方法: 通过双向管道让任意语言通信。(所有语言都会实现管道相关内容)

测试:

通过对比测试,计算出各个流程占用的时间。下面提到的title.txt文件,包含100万行文本,每行文本是从b2b平台取的商品标题

1: 整体流程耗时

# time cat title.txt | ./test > /dev/null

耗时:14.819秒,消耗时间包含:

  1. 进程cat读出文本

  2. 通过管道将数据传入Golang

  3. Golang处理数据,将结果返回到屏幕

2:计算分词函数耗时。方案:去除分词函数的调取,即:注释掉Golang源代码中的调取分词那行的代码

time cat title.txt | ./test > /dev/null

耗时:1.817秒时间,消耗时间包含:

  1. 进程cat读出文本

  2. 通过管道将数据传入Golang

  3. Golang处理数据,将结果返回到屏幕

  4. 分词耗时 = (第一步耗时) - (以上命令所耗时)

  5. 分词耗时 : 14.819 - 1.817 = 13.002秒


3:测试cat进程与Golang进程之间通信所占时间

time cat title.txt > /dev/null

耗时:0.015秒,消耗时间包含:

  1. 进程cat读出文本

  2. 通过管道将数据传入Golang

  3. go处理数据,将结果返回到屏幕

  4. 管道通信耗时:(第二步耗时) - (第三步耗时)

  5. 管道通信耗时: 1.817 - 0.015 = 1.802秒

4:PHP与Golang通信的时间消耗

编写简单的php文件:

<?php
$descriptorspec = array(
    0 => array("pipe", "r"),
    1 => array("pipe", "w")
);
$handle = proc_open(
    '/webroot/go/src/test/test',
    $descriptorspec,
    $pipes
);
$fp = fopen("title.txt", "rb");
while (!feof($fp)) {
    fwrite($pipes['0'], trim(fgets($fp))."\n");
    echo fgets($pipes[1]);
}
fclose($pipes['0']);
fclose($pipes['1']);
proc_close($handle);

流程与上面基本一致,读出title.txt内容,通过双向管道传入Golang进程分词后,再返回给php (比上面的测试多一步:数据再通过管道返回)

time php popen.php > /dev/null

耗时:24.037秒,消耗时间包含:

  1. 进程PHP读出文本

  2. 通过管道将数据传入Golang

  3. Golang处理数据

  4. Golang将返回结果再写入管道,PHP通过管道接收数据

  5. 将结果返回到屏幕

结论:

1:整个分词过程中的耗时分布

使用cat控制逻辑耗时:      14.819 秒

使用PHP控制逻辑耗时:       24.037 秒(比cat多一次管道通信)

单向管道通信耗时:           1.8    秒

Golang中的分词函数耗时: 13.002 秒

2:分词函数的性能: 单进程,100万商品标题分词,耗时13秒

以上时间只包括分词时间,不包括词典载入时间。但在本方案中,词典只载入一次,所以载入词典时间可以忽略(1秒左右)

3:PHP比cat慢

语言层面慢: (24.037 - 1.8 - 14.819) / 14.819 = 50%

单进程对比测试的话,应该不会有哪个语言比cat更快。

相关问题:

1:以上Golang源码中写的是一个循环,也就是会一直从管道中读数据。那么存在一个问题:是不是php进程结束后,Golang的进程还会一直存在?

管道机制自身可解决此问题。管道提供两个接口:读、写。当写进程结束或者意外挂掉时,读进程也会报错,以上Golang源代码中的err逻辑就会执行,Golang进程结束。

但如果PHP进程没有结束,只是暂时没有数据传入,此时Golang进程会一直等待。直到php结束后,Golang进程才会自动结束。

2:能否多个php进程并行读写同一个管道,Golang进程同时为其服务?

在同一个管道中同时写入多个进程是不可行的,因为管道是单向的。如果多个进程同时写入管道,那么Golang的返回值可能会出现混乱。

可以通过启动多个Golang进程来实现,每个PHP进程对应一个Golang进程,以此避免多个进程同时写入同一个管道的问题。

最后,上述解释可能对于熟悉管道和双向管道的人来说并没有太大帮助。如果你对管道不太了解,在代码跑起来时可能没啥问题,但改一手就可能会遇到问题。哈哈,笔者建议你阅读一本书,《UNIX网络编程》卷一和二, 花点时间把它们都看完,可能需要两个月的时间,但非常值得!


阅完此文,您的感想如何?
  • 有用

    1

  • 没用

    0

  • 开心

    0

  • 愤怒

    0

  • 可怜

    0

1.如文章侵犯了您的版权,请发邮件通知本站,该文章将在24小时内删除;
2.本站标注原创的文章,转发时烦请注明来源;
3.交流群: PHP+JS聊天群

相关课文
  • GO语言GORM如何更新字段

  • gorm如何创建记录与模型定义需要注意什么

  • gorm一般查询与高级查询

  • GORM时间戳跟踪及CURD(增删改查)

我要说说
网上宾友点评
1楼 IP61.149.*.*的嘉宾说道: 5个月前
你似乎不太了解php管道涉及到写操作的话是阻塞的, 如果你用的是swoole协程要阻塞怎么办?表面看起来有提升,但非常蹩脚,这并不是什么好方法。最好的方式还是手动编写一个swoole协程tcp连接池, 在接受请求时从连接池里取tcp句柄, 和另外一个语言(例如rust服务)本地/内网作读写逻辑,完事之后还给连接池。维护好连接池健康就很好,反复这样进行。如果实现不了,大一点的任务,建议你老老实实pclose(popen('xxxx', 'r')); 这种方式丢给脚本去做。