ITPUB论坛-中国最专业的IT技术社区

 
 注册
热搜:
查看: 771|回复: 0

[原创] ORACLE 运行时的故障转移实现原理

[复制链接]
论坛徽章:
7
娜美
日期:2017-06-26 15:18:15目光如炬
日期:2017-08-20 22:00:00目光如炬
日期:2017-08-27 22:00:01火眼金睛
日期:2017-09-01 17:00:07目光如炬
日期:2017-09-03 22:00:01火眼金睛
日期:2017-09-30 22:00:01目光如炬
日期:2017-11-26 22:00:00
跳转到指定楼层
1#
发表于 2017-10-26 17:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
目前就职海天起点,服务于电力行业,致力于帮助客户解决生产过程中出现的问题,提高生产效率, 爱好书法,周易!愿结交志同道合之士!共同进步! 微信号:sunyunyi_sun


故障转移分为 connect time connection failover 和 runtime connection failover
connect time connection failover 也就是发起链接时发现节点不可用如何故障转移,10G通过在客户端链接字符串中指定多个ADDRESS
添加failover=ON 实现。11G通过DNS指定最多三个SCAN-IP地址,同10G方式指定多个scan添加failover=on实现。
runtime connection failover 就比较复杂,已经链接的session如何在实例或者服务故障时发生故障转移。下面就讨论方式。
runtime connection failover 有以下两种方式 TAF (Transparent Application Failover) 和 FCF (Fast Connection Failover)

TAF:
1: 仅仅对OCI客户端(比如sqlplus)或连接池有效(比如JDBC-OCIdriver)
2: TAF 可实现select级别的断点续传,不包含select-update, 下面我们就要测试该功能
3:TAF 不能实现DML断点续传

FCF :
依赖oracle FAN event 实现,FAN evnet 通过多种方式传播,方式分为:1:ONS主要有J2EE APP比如JDBC thin,
2:AQ 为.NET APP,3:PMON 通知监听程序,由此也可知道订阅 FAN event事件的客户端基本上全部都支持。
FAN event 分为 HA EVENT 和 LBA EVENT
HA EVENT: service down/up instance down/up
LBA evnet:事件包含percent为负载和service_quality质量。

关于J2EE和.NET客户端配置FCF这里不做讨论,可依据FAN文档进行配置即可。
FCF 不支持断点续传,对于配置好的client接收到FCF event,比如instance down event立刻标记相关的链接失效并且清除,释放
连接池中链接到该实例的空闲链接,当前事物立刻回滚,当app捕获事物错误信息要么返回给最终客户,要么重新建立新链接执行该事物。
那么为什么要立刻标记链接为无效呢?这样做的目的就是让该链接不需要等待网络超时操作,立马得到响应!

下面测试TAF 的select级别的故障转移:
环境为11.2.0.4配置为server pool,如果为admin方式可通过 srvctl add service -h 获取帮助,指定-r -i 参数即可
1:查询server pool
crsctl status serverpool -f

NAME=ora.upgrade_pool
IMPORTANCE=3
MIN_SIZE=2
MAX_SIZE=2
SERVER_NAMES=testup1 testup2
PARENT_POOLS=
EXCLUSIVE_POOLS=
ACL=owner:grid:rwx,pgrpinstall:rwx,other::r--
ACTIVE_SERVERS=testup1 testup2

2:添加service并且修改service属性,相关参数意思查看 -h

srvctl add service -d testdb -s srv_testdb -g upgrade_pool

srvctl modify service -d testdb -s srv_testdb -q TRUE -P BASIC -e SELECT -m BASIC -w 5 -z 3

说明 -P BASIC 为TAF方式 -e SELECT 为级别

srvctl config service -d testdb

Service name: srv_testdb
Service is enabled
Server pool: upgrade_pool
Cardinality: UNIFORM
Disconnect: false
Service role: PRIMARY
Management policy: AUTOMATIC
DTP transaction: false
AQ HA notifications: true
Failover type: SELECT
Failover method: BASIC
TAF failover retries: 3
TAF failover delay: 5
Connection Load Balancing Goal: LONG
Runtime Load Balancing Goal: NONE
TAF policy specification: BASIC
Edition:
Service is enabled on nodes:
Service is disabled on nodes:
3:添加连接串
tnsnames.ora

fan_conn =
  (DESCRIPTION =
     (CONNECT_TIMEOUT=90)
     (RETRY_COUNT=20)
     (RETRY_DELAY=3)
     (TRANSPORT_CONNECT_TIMEOUT=3)
    (ADDRESS_LIST =
      (LOAD_BALANCE=ON)
      (ADDRESS = (PROTOCOL = TCP)(HOST = 100.28.128.139)(PORT = 11521))
    )
    (CONNECT_DATA =
      (SERVICE_NAME = srv_testdb)
    )
  )


4:登录实例

sqlplus user_sun/\"sunyunyi@12334QWE\"@fan_conn --在testdb_2实例登录,分配到testdb_1实例

SQL> show parameter name;

NAME                                 TYPE                             VALUE
------------------------------------ -------------------------------- ---------------
instance_name                        string                           testdb_1

执行select操作,数据较大
select * from pro_table;
....

其他会话停止testdb_1实例
srvctl stop instance -d testdb -n testup2 -i testdb_1

发现select * from pro_table 操作并没有任何影响继续查询中,证明实现了运行时的故障转移
查询实例名:
SQL> show parameter name;

NAME                                 TYPE                             VALUE
------------------------------------ -------------------------------- ------------------------------
instance_name                        string                           testdb_2

已经从testdb_1实例转移到testdb_2实例。





您需要登录后才可以回帖 登录 | 注册

本版积分规则

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档 |
  | | |
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 网站律师 隐私政策 知识产权声明
 北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表